[PC73] 異なる学年で実施される学力テスト項目のIRT垂直尺度化
Keywords:垂直尺度化, IRT, 学力
目 的
個人の学力発達を正確に測定することは,個々に適した指導をおこなう上で必要不可欠である。しかし,学校教育で一般的に実施される学力テストは共通尺度化されていないため,偏差値や学年順位にもとづく相対的な学力変化しか捉えることができない。本研究では,学年をまたいで正確に学力発達を測定できる尺度を開発することを目的とし,項目反応理論(IRT)を用いた垂直尺度化(Kolen & Brennan, 2014;澁谷・柴山,2017)によって,異なる学年で実施される学力テスト項目の共通尺度化を試みた。
方 法
昨年度11月に,A県内の小中学校の小学4年生から中学2年生までの約2,000名を対象とし,国語と算数・数学の2科目のテストを実施した。データ収集デザインには全学年共通のテスト項目と学年独自のテスト項目を組み合わせた,尺度化テストデザイン(scaling test design)を採用している。心理計量モデルはIRTの2パラメタロジスティックモデル(2PLM)であり,尺度調整法としては全学年のテストデータに対して一度に項目パラメタ推定をおこなう同時尺度調整法を採用した。この実行には母集団ごとに異なる平均と標準偏差を推定する多母集団推定(multi group estimation)をおこなった。推定プログラムは熊谷(2009)のEasy Estimation, Version 2.0.6を使用し,学年ごとの5つの母集団を仮定してパラメタの推定をおこなった。
推定母集団分布の平均と標準偏差の計算には,上記ソフトウェアの能力パラメタ推定オプション「POP」を使用した。
結果と考察
項目パラメタの推定の前に,データの一次元性の確認,および項目分析をおこなった。各学年のテストと尺度化テスト項目のみに対して,ポリコリック相関係数行列の固有値を計算し,一次元性を確認した。テスト設計の際の構成概念および固有値の減衰状況から全体として一次元であると判断した。なお,IRTモデルの一次元性の仮定が守られているときは同時尺度調整法の使用が推奨されており(Young & Tong, 2016)採用した尺度調整法は適切である。続いて,各項目の通過率,点双列相関係数を計算し,通過率が単調増加しない,あるいは点双列相関係数が著しく低い項目を削除した。削除された項目数は,国語で3項目,数学で2項目であり,各テストとも全学年共通の項目を2項目削除した。
項目を削除した後,2PLMの項目パラメタと各群の母集団分布を推定した。
推定された垂直尺度の特徴を確認するために各群の母集団分布の平均と標準偏差を計算し,さらにYen(1986)の効果量(effect size)の指標を用いて学年分布の独立性を調べた(Table1)。効果量はjを学年の番号,nを受検者数,x ̅を平均,s^2を分散とおくと,のように計算できる。
また,前川(1991)にもとづいて求めた算数と数学の各学年の推定母集団分布の累積分布関数はFigure 1のようになる。
平均と標準偏差,効果量の3つの指標から,概ね学年レベルが上がるにつれて分布間の距離が接近していること明らかになった。このことから中学2年生付近で学力増加が減少する可能性が示唆された。その要因もふくめ,今後はさらに上級学年も対象とした尺度の拡張のほか,異なるモデルや尺度調整法の適用による検討が必要である。
付 記
本研究はJSPS科研費16H03731の助成を受けたものです。
個人の学力発達を正確に測定することは,個々に適した指導をおこなう上で必要不可欠である。しかし,学校教育で一般的に実施される学力テストは共通尺度化されていないため,偏差値や学年順位にもとづく相対的な学力変化しか捉えることができない。本研究では,学年をまたいで正確に学力発達を測定できる尺度を開発することを目的とし,項目反応理論(IRT)を用いた垂直尺度化(Kolen & Brennan, 2014;澁谷・柴山,2017)によって,異なる学年で実施される学力テスト項目の共通尺度化を試みた。
方 法
昨年度11月に,A県内の小中学校の小学4年生から中学2年生までの約2,000名を対象とし,国語と算数・数学の2科目のテストを実施した。データ収集デザインには全学年共通のテスト項目と学年独自のテスト項目を組み合わせた,尺度化テストデザイン(scaling test design)を採用している。心理計量モデルはIRTの2パラメタロジスティックモデル(2PLM)であり,尺度調整法としては全学年のテストデータに対して一度に項目パラメタ推定をおこなう同時尺度調整法を採用した。この実行には母集団ごとに異なる平均と標準偏差を推定する多母集団推定(multi group estimation)をおこなった。推定プログラムは熊谷(2009)のEasy Estimation, Version 2.0.6を使用し,学年ごとの5つの母集団を仮定してパラメタの推定をおこなった。
推定母集団分布の平均と標準偏差の計算には,上記ソフトウェアの能力パラメタ推定オプション「POP」を使用した。
結果と考察
項目パラメタの推定の前に,データの一次元性の確認,および項目分析をおこなった。各学年のテストと尺度化テスト項目のみに対して,ポリコリック相関係数行列の固有値を計算し,一次元性を確認した。テスト設計の際の構成概念および固有値の減衰状況から全体として一次元であると判断した。なお,IRTモデルの一次元性の仮定が守られているときは同時尺度調整法の使用が推奨されており(Young & Tong, 2016)採用した尺度調整法は適切である。続いて,各項目の通過率,点双列相関係数を計算し,通過率が単調増加しない,あるいは点双列相関係数が著しく低い項目を削除した。削除された項目数は,国語で3項目,数学で2項目であり,各テストとも全学年共通の項目を2項目削除した。
項目を削除した後,2PLMの項目パラメタと各群の母集団分布を推定した。
推定された垂直尺度の特徴を確認するために各群の母集団分布の平均と標準偏差を計算し,さらにYen(1986)の効果量(effect size)の指標を用いて学年分布の独立性を調べた(Table1)。効果量はjを学年の番号,nを受検者数,x ̅を平均,s^2を分散とおくと,のように計算できる。
また,前川(1991)にもとづいて求めた算数と数学の各学年の推定母集団分布の累積分布関数はFigure 1のようになる。
平均と標準偏差,効果量の3つの指標から,概ね学年レベルが上がるにつれて分布間の距離が接近していること明らかになった。このことから中学2年生付近で学力増加が減少する可能性が示唆された。その要因もふくめ,今後はさらに上級学年も対象とした尺度の拡張のほか,異なるモデルや尺度調整法の適用による検討が必要である。
付 記
本研究はJSPS科研費16H03731の助成を受けたものです。