[PB030] 近年のTIMSS調査における中学校第2学年地学領域の共通項目の統計的な特徴の変化とトピックとの関連
キーワード:項目反応理論, カリキュラム, TIMSS
問 題
TIMSS調査は,各国の生徒の理数の学力の特徴が各国のカリキュラムの特徴とどのように関連するのかについて分析するのに適していると考えられる。萩原・松原(2013)は,TIMSS2007調査(T07)とTIMSS2011調査(T11)の中学校第2学年理科における共通項目の統計的な特徴の変化を,項目反応理論を用いて,特異項目機能の特殊な場合であるItem Parameter Drift(Bock et al., 1988)として捉えた。そして,この変化と,各項目が調査対象時点までの国のカリキュラムに含まれているかどうかについて示したTest-Curriculum Matchingとの間の関連を調べた。この結果,調査時期によるカリキュラムの被覆状況の異同と,この変化の間に関連性は特に見られなかった。本研究では,上記の統計分析の枠組みを用いて,特に地学領域に焦点化した結果を報告する。ただし,各項目を同一の単元内容でまとめたトピックとの関連を調べる。
方 法
分析対象:日本の中学校第2学年の生徒のうち,理科の問題が実施された生徒(T07…146校の4,307名,T11…138校の4,407名)を対象とした。また,地学領域の59項目(T07のみ…20項目,T11のみ…20項目,共通項目…19項目)を対象とした。なお,地学領域のトピックは四つであった。
分析モデル:1点の項目については2母数ロジスティックモデルを,2点の項目については段階反応モデルを適用した。T07の生徒を参照集団(標準正規分布を仮定)とし,T11の生徒を焦点集団(正規分布の平均と分散を推定)とした。三つのモデルを設定した。第1は,各共通項目の項目母数は調査時期間で等しいと制約したモデルである。第2は,各共通項目の困難度が調査時期間で異なるが,困難度の平均値は調査時期間で等しいと制約したモデルである。第3は,各共通項目の困難度だけでなく識別力も調査時期間で異なるが,困難度の平均値と識別力の平均値は調査時期間でそれぞれ等しいと制約したモデルである。
分析方法:層化二段階クラスター抽出及び標本加重を考慮し,これらに関する変数(層の変数,学校番号の変数,各生徒の標本加重の変数)を用い,Mplus(Muth?n & Muth?n, 1998?2012, version 7.11)のMLRという推定法によって分析した。無解答は未達の場合を含め誤答とした。
結果・考察
3項目(T07…1項目,共通項目…2項目)については,項目識別力が小さかったため除外した。残りの56項目・59点(共通項目は17項目,18点)について,三つのモデルで分析した結果,2番目のモデルの適合度が相対的に高かった。このモデルにおいて,共通項目の困難度の平均値が調査時期間で等しいという帰無仮説をそれぞれのトピックで個別に設定し,ワルド検定を行った。この結果,「地球のプロセス,循環と歴史」のトピック(共通項目は6項目,6点)においてのみ,帰無仮説が棄却された(χ2(1) = 12.649)。このトピックでの共通項目のテスト特性曲線を図1に示す。
このトピックにおいては,能力特性の水準が同じだとしても,2010年度に中学校第2学年だった生徒の方が,2006年度にこの学年だった生徒よりも解き易かったという傾向が見られた。
文 献
Bock, R. D., Muraki, E., & Pfeiffenberger, W. (1988). Item pool maintenance in the presence of item parameter drift. Journal of Educational Measurement, 25, 275-285.
萩原康仁・松原憲治 (2013). TIMSS2011調査(理科)の結果と分析(2):項目反応理論を用いた日本の中学生におけるTIMSS2007調査との比較分析 日本理科教育学会全国大会発表論文集,11,227.
Muth?n, L. K., & Muth?n, B. O. (1998?2012). Mplus User’s Guide. Seventh Edition. Los Angeles, CA: Muth?n & Muth?n.
※科研費(25381060)の助成を受けた。
TIMSS調査は,各国の生徒の理数の学力の特徴が各国のカリキュラムの特徴とどのように関連するのかについて分析するのに適していると考えられる。萩原・松原(2013)は,TIMSS2007調査(T07)とTIMSS2011調査(T11)の中学校第2学年理科における共通項目の統計的な特徴の変化を,項目反応理論を用いて,特異項目機能の特殊な場合であるItem Parameter Drift(Bock et al., 1988)として捉えた。そして,この変化と,各項目が調査対象時点までの国のカリキュラムに含まれているかどうかについて示したTest-Curriculum Matchingとの間の関連を調べた。この結果,調査時期によるカリキュラムの被覆状況の異同と,この変化の間に関連性は特に見られなかった。本研究では,上記の統計分析の枠組みを用いて,特に地学領域に焦点化した結果を報告する。ただし,各項目を同一の単元内容でまとめたトピックとの関連を調べる。
方 法
分析対象:日本の中学校第2学年の生徒のうち,理科の問題が実施された生徒(T07…146校の4,307名,T11…138校の4,407名)を対象とした。また,地学領域の59項目(T07のみ…20項目,T11のみ…20項目,共通項目…19項目)を対象とした。なお,地学領域のトピックは四つであった。
分析モデル:1点の項目については2母数ロジスティックモデルを,2点の項目については段階反応モデルを適用した。T07の生徒を参照集団(標準正規分布を仮定)とし,T11の生徒を焦点集団(正規分布の平均と分散を推定)とした。三つのモデルを設定した。第1は,各共通項目の項目母数は調査時期間で等しいと制約したモデルである。第2は,各共通項目の困難度が調査時期間で異なるが,困難度の平均値は調査時期間で等しいと制約したモデルである。第3は,各共通項目の困難度だけでなく識別力も調査時期間で異なるが,困難度の平均値と識別力の平均値は調査時期間でそれぞれ等しいと制約したモデルである。
分析方法:層化二段階クラスター抽出及び標本加重を考慮し,これらに関する変数(層の変数,学校番号の変数,各生徒の標本加重の変数)を用い,Mplus(Muth?n & Muth?n, 1998?2012, version 7.11)のMLRという推定法によって分析した。無解答は未達の場合を含め誤答とした。
結果・考察
3項目(T07…1項目,共通項目…2項目)については,項目識別力が小さかったため除外した。残りの56項目・59点(共通項目は17項目,18点)について,三つのモデルで分析した結果,2番目のモデルの適合度が相対的に高かった。このモデルにおいて,共通項目の困難度の平均値が調査時期間で等しいという帰無仮説をそれぞれのトピックで個別に設定し,ワルド検定を行った。この結果,「地球のプロセス,循環と歴史」のトピック(共通項目は6項目,6点)においてのみ,帰無仮説が棄却された(χ2(1) = 12.649)。このトピックでの共通項目のテスト特性曲線を図1に示す。
このトピックにおいては,能力特性の水準が同じだとしても,2010年度に中学校第2学年だった生徒の方が,2006年度にこの学年だった生徒よりも解き易かったという傾向が見られた。
文 献
Bock, R. D., Muraki, E., & Pfeiffenberger, W. (1988). Item pool maintenance in the presence of item parameter drift. Journal of Educational Measurement, 25, 275-285.
萩原康仁・松原憲治 (2013). TIMSS2011調査(理科)の結果と分析(2):項目反応理論を用いた日本の中学生におけるTIMSS2007調査との比較分析 日本理科教育学会全国大会発表論文集,11,227.
Muth?n, L. K., & Muth?n, B. O. (1998?2012). Mplus User’s Guide. Seventh Edition. Los Angeles, CA: Muth?n & Muth?n.
※科研費(25381060)の助成を受けた。