TIMSS2011数学データにおける多次元IRTを基盤とした 妥当性の検証について

坂本佑太朗

[PB051] TIMSS2011数学データにおける多次元IRTを基盤とした妥当性の検証について

坂本佑太朗 (株式会社リクルートマネジメントソリューションズ)

キーワード：構成概念妥当性, 多次元IRT, 双因子モデル

問題と目的
項目反応理論（IRT, Lord, 1952）に代表されるテストの測定技術の実用化が加速する一方で，構成概念（construct）を精緻に測定することの重要性も再認識される必要がある（石井，2014）。そこで本研究では，近年わが国でも注目されている多次元IRT（multidimensional IRT）をテストの妥当性（validity）検証のツールとして使用することにより，構成概念妥当性の「構造的な側面」（AERA, 2014；Messick, 1989, 1995）について計量的なエビデンスを与えることを目的とする。
方法
データ 2011年国際数学・理科教育動向調査（TIMSS2011）における数学を受検したわが国の中学校２年生データ（N＝4,414）を使用する。今回は下位領域として知識・推論・応用が設定されている認知的領域（Martin & Mullis，2012）の枠組みについて検討する。
モデル理論的な基盤は補償型（compensatory）多次元2PLモデル，
である。このときは項目の識別力パラメータ（行列），は困難度に関連するパラメータ（スカラー）を示している。これを使ってMartin & Mullis（2012）に基づき，モデルＡとして１次元IRTモデル，モデルＢとして下位領域間の因子間相関を認めた確認的な多次元IRTモデル，モデルＣとして項目全体に対して一般因子（general factor）の存在を認め，それを統制した上でグループ因子（group factor）としての下位領域による影響を検討できる双因子モデル（bifactor model）（Gibbons & Hedeker, 1992）を設定した。ただし，モデルＣにおいても下位領域間の因子間相関を認めている。なお分析にはＲパッケージmirt1.7を使用した。
結果
Table 1から一般因子の存在を認めることによって下位領域間の相関が弱まっていることが確認できる。またTable 2における情報量基準の比較からAICとAICcはモデルＣ，SABICはモデルＢ，BICはモデルＡを支持する結果となった。しかしながら，実質的には項目識別力パラメータの値から，項目情報量的にモデルＡが最も十分な情報量を保有していることが示され，測定論的な見地から１次元性を仮定するモデルＡで十分であることが示唆される。

講演情報

ポスター発表 PB

[PB051] TIMSS2011数学データにおける多次元IRTを基盤とした妥当性の検証について

講演情報

ポスター発表 PB

[PB051] TIMSS2011数学データにおける多次元IRTを基盤とした 妥当性の検証について

[PB051] TIMSS2011数学データにおける多次元IRTを基盤とした妥当性の検証について