[P344] 英語スピーキングテストにおけるテストデザインの違いがパラメタ推定値に及ぼす影響
評価の厳しさパラメタを評価者ごとに推定するデザインの検討
Keywords:多相ラッシュモデル、パフォーマンステスト、項目反応理論
京都工芸繊維大学英語スピーキングテスト(KIT test)は,大学生における英語の発話能力を測るためのテストとして実施されてきた。従来,評価者の評価の厳しさについて,英語母語話者(NS)と非母語話者(NNS)の2グループを考え,グループごとの評価の厳しさを検討するデザインが用いられてきた。一方で,評価者ごとの評価の厳しさを個別に検討する必要が生じたことから,評価者に受験者の一部の英語発話を追加で評定させる新たな評価デザインを導入する必要が指摘された。本研究では2グループの評価者を仮定するデザインと,評価者個別の評価の厳しさパラメタを推定するデザインで,受験者の能力値や項目の困難度といったパラメタがどのように変わるかを検討した。多相ラッシュモデルの分析結果から,能力値の推定値には大きな違いがみられず,項目困難度にも明らかな値の違いは見られない結果であり,新しいデザインが有用である可能性が示唆された。