日本教育心理学会第61回総会

Presentation information

ポスター発表

[PE] ポスター発表 PE(01-67)

Sun. Sep 15, 2019 1:30 PM - 3:30 PM 3号館 1階 (カフェテリア)

在席責任時間
奇数番号13:30~14:30
偶数番号14:30~15:30

[PE67] 少数カテゴリの併合がパラメタ推定に及ぼす影響

パフォーマンステストデータに多相ラッシュモデルを適用した場合

光永悠彦1, 羽藤由美#2, 神澤克徳#3 (1.名古屋大学, 2.京都工芸繊維大学, 3.京都工芸繊維大学)

Keywords:項目反応理論、言語テスト、パフォーマンス評価

背景と目的
 京都工芸繊維大学において行われている,英語発話能力を測定するためのテスト(KIT test,Hato et al, 2018参照)では,受験者の発話内容が2名の評価者によって,二つの評価観点(Task Achievement及びTask Delivery)から評価される。発話パフォーマンスはルーブリックにしたがって複数の評価者によって評価され,多相ラッシュモデル(many-facet Rasch model,MFRM; Linacre, 1994)により尺度化される。KIT testでは6カテゴリからなるルーブリックが用いられているが,(1)最下位カテゴリに入る受験者数が少数(10名程度)になった場合,MFRMの推定が不安定になる恐れがある,(2)最下位カテゴリに対応するカテゴリ境界パラメタの標準誤差が他のカテゴリにおけるパラメタよりも顕著に大きくなる(最大10倍程度)という理由により,最下位カテゴリをその一つ上のカテゴリと併合し,5カテゴリのデータを用いて分析を行ってきた。本研究では,6カテゴリのデータと5カテゴリのデータの結果推定されたパラメタの点推定値を比較し,カテゴリを併合することにより項目困難度や受験者の能力母数の推定結果がどのように変動するかを,最下位カテゴリと判断された頻度との関連に着目して検討する。最下位カテゴリと判断された受験者は能力が相対的に低い受験者が多いため,最下位カテゴリと判断された頻度が大きな項目において,困難度パラメタの点推定値も変動することが予想される。
方  法
 2018年12月に実施されたKIT testによる661名のデータを用いた。9問からなる問題冊子を3種類用意し,受験者(大学1年次生)には3種類の冊子のうちランダムに一つを割り付けた。また66名のモニター受験者に対し,3種類の問題冊子すべてを解答させた。解答はすべて英語発話で行わせ,その内容を録音しておき,一つの解答につき評価者(英語ネイティブ・ノンネイティブ)を2名割り当て,独立に二つの評価観点(Task Achievement[TA]及びTask Delivery[TD])ごとに6件法で評価させた。
 分析については(1)「評価者」「評価観点」「項目」「受験者」の4相を仮定したMFRM(Overall)及び(2)TAのみの評価で,3相を仮定したMFRM(TA),(3)TDのみで3相を仮定したMFRM(TD)の三通りで行った。(1)から(3)のいずれについても,最下位カテゴリを一つ上のカテゴリに併合した場合(NCAT5)と,元の6カテゴリの場合(NCAT6)の場合で分析し,結果を比較した。いずれの分析もFacets 3.71.4を用いて行った。ただし,評価者の属性を考慮し,評価者と評価観点との間に交互作用項を仮定した。
結果と考察
 TA,TDそれぞれで14,274回の評定が行われ,そのうちTAで78,TDで47個の最下位カテゴリの評定が下された。全体に占める割合はそれぞれ0.55%,0.33%であった。
 項目困難度の推定結果を比較すると,Overallにおいて最も最下位カテゴリと評定された頻度が大きかった(頻度=25)項目においては,推定値が0.01の差であった。一方で,推定値の絶対値差は最大0.04であり,最下位カテゴリ頻度は5であった。またTAやTDに限定した場合の推定値の絶対値差は最大0.04であったが,最下位カテゴリ頻度が1の項目であっても絶対値差が最大となる場合もみられ,最下位カテゴリ頻度が直線的に推定値差と関連する傾向はみられなかった。
 Table 1に,受験者ごとに推定された期待カテゴリが,カテゴリ数5と6の場合で異なった受験者数を示した。わずかながら,期待カテゴリが変化する受験者が存在することがわかった。最下位カテゴリ数が多い場合の検討が今後望まれる。
引用文献
Linacre, J.M. (1994). Many-facet Rasch measurement. Chicago: MESA Press.
Hato, Y., Kanzawa, K., Mitsunaga, H. & Healy, S.(2018). Developing a computer-based speaking test of English as a lingua franca: Preliminary results and remaining challenges. Waseda Working Papers in ELF, 7, 87-99.
付  記 
 本研究は科学研究費補助金(基盤研究(B),課題番号16H03448の助成を受けて行われた。