日本教育心理学会第57回総会

講演情報

ポスター発表

ポスター発表 PB

2015年8月26日(水) 13:30 〜 15:30 メインホールA (2階)

[PB051] TIMSS2011数学データにおける多次元IRTを基盤とした 妥当性の検証について

坂本佑太朗 (株式会社リクルートマネジメントソリューションズ)

キーワード:構成概念妥当性, 多次元IRT, 双因子モデル

問題と目的
項目反応理論(IRT, Lord, 1952)に代表されるテストの測定技術の実用化が加速する一方で,構成概念(construct)を精緻に測定することの重要性も再認識される必要がある(石井,2014)。そこで本研究では,近年わが国でも注目されている多次元IRT(multidimensional IRT)をテストの妥当性(validity)検証のツールとして使用することにより,構成概念妥当性の「構造的な側面」(AERA, 2014;Messick, 1989, 1995)について計量的なエビデンスを与えることを目的とする。
方法
データ 2011年国際数学・理科教育動向調査(TIMSS2011)における数学を受検したわが国の中学校2年生データ(N=4,414)を使用する。今回は下位領域として知識・推論・応用が設定されている認知的領域(Martin & Mullis,2012)の枠組みについて検討する。
モデル 理論的な基盤は補償型(compensatory)多次元2PLモデル,
である。このときは項目の識別力パラメータ(行列),は困難度に関連するパラメータ(スカラー)を示している。これを使ってMartin & Mullis(2012)に基づき,モデルAとして1次元IRTモデル,モデルBとして下位領域間の因子間相関を認めた確認的な多次元IRTモデル,モデルCとして項目全体に対して一般因子(general factor)の存在を認め,それを統制した上でグループ因子(group factor)としての下位領域による影響を検討できる双因子モデル(bifactor model)(Gibbons & Hedeker, 1992)を設定した。ただし,モデルCにおいても下位領域間の因子間相関を認めている。なお分析にはRパッケージmirt1.7を使用した。
結果
Table 1から一般因子の存在を認めることによって下位領域間の相関が弱まっていることが確認できる。またTable 2における情報量基準の比較からAICとAICcはモデルC,SABICはモデルB,BICはモデルAを支持する結果となった。しかしながら,実質的には項目識別力パラメータの値から,項目情報量的にモデルAが最も十分な情報量を保有していることが示され,測定論的な見地から1次元性を仮定するモデルAで十分であることが示唆される。