[PE71] 学級規模のTIMSS2015小学校第4学年理科到達度への効果
操作変数を用いた家庭の学習資源の多寡による部分母集団の分析
キーワード:学級規模, 操作変数, 部分母集団
問題・目的
学級規模の学力への影響が研究間で異なる現象(クラスサイズパズル)の背景要因は多岐にわたる(山森,2016)。データ分析の観点からは,学級規模を説明変数とし,学力を被説明変数として回帰係数を推定しても,学級規模にも学力にも影響を与える共変量がモデルから欠落した場合,学級規模と学力の誤差との間に相関が生じる(が推定できない)という内生性の問題が生じ,通常の最小二乗推定量は一致性を持たない。これに対処するために,説明変数とは強い相関があるが被説明変数の誤差とは相関がない変数を操作変数として用いて,回帰係数を一致推定できることを利用した実証研究が特に経済学で行われている(e.g., Angrist & Lavy, 1999)。こうした研究では,学年児童数から算出される上限40人で学級編制した場合の学級規模を操作変数とすることが多い。
一方で,この操作変数を用いることが難しい場合がある。例えば,国際的な学力調査のTIMSS2015の小学校では,第4学年の算数・理科の教育到達度が測定され,学校質問紙には学年児童数についての質問項目があるが,学年児童数の変数は公開データからは除かれている。また,仮にこれを取得したとしても,無回答の学校については欠損扱いとなる。このため,公開データにある学年児童数に関する欠損のない変数が操作変数の候補となる。TIMSSでは,調査対象校を抽出する際に学年児童数に基づく規模による確率比例抽出を行っており,日本の公開データには,2年度前のこの規模と学校数から抽出層別に求めた学校の重み因子の変数がある。この変数は2年後の学級規模とは強い相関があると考えられ,被説明変数となる2年後の教育到達度の誤差との相関は考えにくい点で操作変数の候補になる。加えて,学年に2学級以上ある場合と比べて,単学級では取りうる学級規模の範囲が著しく異なることから,単学級かどうかについても操作変数の候補になりうる。
ただし,教育心理学独自のパラダイムである適性処遇交互作用の見地からは,学級規模の効果も個人の適性によって異なることが想定されるため(山森,2013),操作変数を用いた上記の分析枠組みをそのまま用いることは必ずしも適切ではない。適性そのものではないが,家庭環境が学力の予測変数として取り上げられることは多く,学級規模の学力への効果を家庭環境の観点から検討することには教育条件の整備の面で意義がある。本研究では,TIMSS2015小学校第4学年理科到達度への学級規模の効果を,家庭の学習資源の多寡による部分母集団の分析(subpopulation analysis)によって探索的に検討する。
方 法
分析対象:TIMSS2015の日本の小学校公開データ。
変数とモデル:部分母集団・・・児童及び保護者質問紙に基づく家庭の学習資源の指標(3種類)。この種類別に下記の分析を行った。被説明変数・・・理科到達度の五つの推算値(500を引き,100で割った)。説明変数(被説明変数へのパス)・・・学級規模(教師質問紙への回答と公開データから求めた児童数の大きい方)。操作変数(説明変数へのパス)・・・学校の重み因子及び単学級かのダミー変数。共変量(被説明変数及び説明変数へのパス)・・・児童の性別・年齢,学校質問紙に基づく児童の経済的背景による学校の構成の指標(3種類及び欠損,欠損を参照カテゴリ),教師質問紙に基づく各児童の理科の担当教師が(皆)女性かのダミー変数,(皆)理科の専門かのダミー変数,及びその(平均)教職経験年数。なお,説明変数の誤差と被説明変数の誤差との間に共分散を設定し推定した。
分析方法:Mplus ver. 8(Muthén & Muthén, 1998-2017)を用い,学校IDのクラスタリングと各児童の標本の重み,部分母集団,及び推算値を考慮する方法で最尤推定した。
結果・考察
まず,二つの操作変数と共変量で学級規模を予測する重回帰分析を,Stata 15.1(Stata Corp., 2017)のsvy: regressで行った結果,操作変数群のF値はどの部分母集団でも目安の10を超えていた。次に,方法で述べたモデルの平均の適合度は,家庭の学習資源が多い児童(127校523人)で,χ2(1)=2.861,RMSEA=0.043,CFI=0.987,SRMR=0.004,ある程度家庭の学習資源がある児童(148校3678人)で,χ2(1)=1.653,RMSEA=0.012,CFI=0.998,SRMR=0.003,家庭の学習資源が少ない児童(47校67人)で,χ2(1)=0.459,RMSEA=0.000,CFI=1.000,SRMR=0.003であった。各部分母集団における学級規模の係数の推定値は順に-0.005,0.006,-0.046であり,検定の数を3としてHolmの方法で全体の有意水準が5%になるようにした結果,家庭の学習資源が少ない児童で有意であった。なお,共変量がないモデルでも同様の結果であった。
モデルの適合度は概ね良く,結果を解釈すると,当該の操作変数を通じた学級規模の増による小学校第4学年理科到達度への平均的な効果は,特に家庭の学習資源が少ない児童には負であることが示唆された。ただし,分割したデータでの分析結果であり,別のデータセット等で再現可能性を検証する必要性が残された。
付記・謝辞
SOURCE: TIMSS 2015 User Guide for the International Database. Copyright © 2017 International Association for the Evaluation of Educational Achievement (IEA). Publishers: TIMSS & PIRLS International Study Center, Lynch School of Education, Boston College and IEA.
本研究の一部は JSPS 科研費(17K04599)の助成を受けたものである。
学級規模の学力への影響が研究間で異なる現象(クラスサイズパズル)の背景要因は多岐にわたる(山森,2016)。データ分析の観点からは,学級規模を説明変数とし,学力を被説明変数として回帰係数を推定しても,学級規模にも学力にも影響を与える共変量がモデルから欠落した場合,学級規模と学力の誤差との間に相関が生じる(が推定できない)という内生性の問題が生じ,通常の最小二乗推定量は一致性を持たない。これに対処するために,説明変数とは強い相関があるが被説明変数の誤差とは相関がない変数を操作変数として用いて,回帰係数を一致推定できることを利用した実証研究が特に経済学で行われている(e.g., Angrist & Lavy, 1999)。こうした研究では,学年児童数から算出される上限40人で学級編制した場合の学級規模を操作変数とすることが多い。
一方で,この操作変数を用いることが難しい場合がある。例えば,国際的な学力調査のTIMSS2015の小学校では,第4学年の算数・理科の教育到達度が測定され,学校質問紙には学年児童数についての質問項目があるが,学年児童数の変数は公開データからは除かれている。また,仮にこれを取得したとしても,無回答の学校については欠損扱いとなる。このため,公開データにある学年児童数に関する欠損のない変数が操作変数の候補となる。TIMSSでは,調査対象校を抽出する際に学年児童数に基づく規模による確率比例抽出を行っており,日本の公開データには,2年度前のこの規模と学校数から抽出層別に求めた学校の重み因子の変数がある。この変数は2年後の学級規模とは強い相関があると考えられ,被説明変数となる2年後の教育到達度の誤差との相関は考えにくい点で操作変数の候補になる。加えて,学年に2学級以上ある場合と比べて,単学級では取りうる学級規模の範囲が著しく異なることから,単学級かどうかについても操作変数の候補になりうる。
ただし,教育心理学独自のパラダイムである適性処遇交互作用の見地からは,学級規模の効果も個人の適性によって異なることが想定されるため(山森,2013),操作変数を用いた上記の分析枠組みをそのまま用いることは必ずしも適切ではない。適性そのものではないが,家庭環境が学力の予測変数として取り上げられることは多く,学級規模の学力への効果を家庭環境の観点から検討することには教育条件の整備の面で意義がある。本研究では,TIMSS2015小学校第4学年理科到達度への学級規模の効果を,家庭の学習資源の多寡による部分母集団の分析(subpopulation analysis)によって探索的に検討する。
方 法
分析対象:TIMSS2015の日本の小学校公開データ。
変数とモデル:部分母集団・・・児童及び保護者質問紙に基づく家庭の学習資源の指標(3種類)。この種類別に下記の分析を行った。被説明変数・・・理科到達度の五つの推算値(500を引き,100で割った)。説明変数(被説明変数へのパス)・・・学級規模(教師質問紙への回答と公開データから求めた児童数の大きい方)。操作変数(説明変数へのパス)・・・学校の重み因子及び単学級かのダミー変数。共変量(被説明変数及び説明変数へのパス)・・・児童の性別・年齢,学校質問紙に基づく児童の経済的背景による学校の構成の指標(3種類及び欠損,欠損を参照カテゴリ),教師質問紙に基づく各児童の理科の担当教師が(皆)女性かのダミー変数,(皆)理科の専門かのダミー変数,及びその(平均)教職経験年数。なお,説明変数の誤差と被説明変数の誤差との間に共分散を設定し推定した。
分析方法:Mplus ver. 8(Muthén & Muthén, 1998-2017)を用い,学校IDのクラスタリングと各児童の標本の重み,部分母集団,及び推算値を考慮する方法で最尤推定した。
結果・考察
まず,二つの操作変数と共変量で学級規模を予測する重回帰分析を,Stata 15.1(Stata Corp., 2017)のsvy: regressで行った結果,操作変数群のF値はどの部分母集団でも目安の10を超えていた。次に,方法で述べたモデルの平均の適合度は,家庭の学習資源が多い児童(127校523人)で,χ2(1)=2.861,RMSEA=0.043,CFI=0.987,SRMR=0.004,ある程度家庭の学習資源がある児童(148校3678人)で,χ2(1)=1.653,RMSEA=0.012,CFI=0.998,SRMR=0.003,家庭の学習資源が少ない児童(47校67人)で,χ2(1)=0.459,RMSEA=0.000,CFI=1.000,SRMR=0.003であった。各部分母集団における学級規模の係数の推定値は順に-0.005,0.006,-0.046であり,検定の数を3としてHolmの方法で全体の有意水準が5%になるようにした結果,家庭の学習資源が少ない児童で有意であった。なお,共変量がないモデルでも同様の結果であった。
モデルの適合度は概ね良く,結果を解釈すると,当該の操作変数を通じた学級規模の増による小学校第4学年理科到達度への平均的な効果は,特に家庭の学習資源が少ない児童には負であることが示唆された。ただし,分割したデータでの分析結果であり,別のデータセット等で再現可能性を検証する必要性が残された。
付記・謝辞
SOURCE: TIMSS 2015 User Guide for the International Database. Copyright © 2017 International Association for the Evaluation of Educational Achievement (IEA). Publishers: TIMSS & PIRLS International Study Center, Lynch School of Education, Boston College and IEA.
本研究の一部は JSPS 科研費(17K04599)の助成を受けたものである。