[研企シ] SEMは心理学に何をもたらしたか?
キーワード:SEM(構造方程式モデリング)、共分散構造分析
現状に対する憂いと企画趣旨
吉田寿夫
SEM(structural equation modeling:構造方程式モデリング)ないし共分散構造分析と呼ばれる統計手法は,この30年ほどの間,心理学を始めとする多くの研究領域において多用されてきた。それは,既存の多くの分析法を包括する大規模なものであるとともに,コンピュータなしでは行うことができない,ほとんどのユーザーにとって「計算過程がブラックボックス化している」と言えるであろうものである。
筆者は,論文の審査などを行うなかでSEMを用いている論文を多々読んできたが,率直に言って,「へえー」とか「なるほど」といった感覚を生じさせてくれる脱常識性が高いと判断されるものや,著書などで引用したり授業で紹介したりしようと思うものに遭遇したことがない。そして,そればかりか,おそらくはSEMの数学的な高度さに惑わされて,その力を過大視し,不当な結論を一人歩きさせていると言えるであろう状態が蔓延っているように感じている。
主たる問題は,多くの専門家が「SEMは基本的に因果関係を立証する力を有するものではない」ことについて警鐘を鳴らしてきたにもかかわらず,ユーザーの側がこのことをきちんと踏まえていないことにあると考えられる。そして,このことに関連して「予測と因果の混同」と言えるであろう事態が散見されるとともに,「適合度への過度の注目」,「適合度の評価における論理的必然性がないであろう基準の無批判な受け入れ」,「(重回帰分析におけるR2に相当する)説明力の非重視」,「パス係数の評価における統計的検定への過度の依拠」,「潜在変数間の関係の検討における希薄化の不適切な修正」,「測定の妥当性に関わる問題の軽視」,「個々人における心理過程の究明であることを踏まえない,個人間変動に基づく検討」などといった問題が指摘されてきた。
本シンポジウムでは,以上のような現状を踏まえ,SEMの有効性の過大視・不適切な適用や弊害の発生の抑制,適切な適用の促進といったことを目的として,現実の適用において散見される種々の問題事象を提示して,それらについて議論するとともに,SEMならではだと考えられる優れた適用例を提示して,SEMを用いることのメリットについて議論する。そして,そのうえで,適切な適用を促進し,不適切な適用を抑制するための方策について提言することができればと考えている。
SEMの営為の根本を見つめなおす
荘島宏二郎
SEMの最大の魅力は,何と言っても分析結果の視覚的了解性の高さである。端的に言って,パス図(path diagram)を用いたデータの要約結果,すなわち「情報の可視化(information visualization)」に優れている。SEM以前は,t検定・分散分析・回帰分析・因子分析が主な分析手法であったが,それらは,大抵,表によって結果が表示されていたため,パス図による現象の描写力の高さに多くの研究者が魅力を感じた。
また,計算機の高度化が手伝い,従来,理論的には考えられていたが,エンドユーザの計算機ではなかなか実現することが難しかったカテゴリカルデータ解析・多母集団分析・潜在クラス分析・マルチレベル分析・欠測データ分析などの「重たい」分析手法が,SEMというプラットフォームで花開いた。
今や,単なる「共分散構造」分析ではなく,それらの諸分析も含めての構造方程式モデリング(SEM)である。SEMに万能感を抱く研究者・分析者も多いのではないだろうか。
ほかにも,SEMの普及により,科学的意思決定がほとんどp値一辺倒だった時代から,適合度指標や自由度を総合的に見ていくという科学的態度を養うことに貢献したことも大きい。
反面,SEMの普及に伴い,肥大したSEMに対する信頼に基づく「因果に関する誤った言及(限定的に言及できる場合があるが)」や,SEMに関する不識・不案内に基づく「誤差間共分散の乱用」,「甘い適合度指標への過度の依存」,「パス図におけるトポロジカルな配置と印象操作」など,様々な改善すべき問題点がある。
さらに,SEMもまた方法論であることを考えると,本質的に複雑であり,超高次元多様体であるかのような現象のある一面を切り取ってくるものでしかない。当然,SEMの分析だけで現象を理解することはできず,他の方法と組み合わせて(方法論的多次元主義),現象を立体化しなくてはいけないが,SEMを過信する者ほど,往々にしてそういう態度は希薄である。
本報告では,心理統計学の専門家の観点から,統計分析という営為の本質に踏み込みつつ,「SEMが何をしているものか」ということについて試論(私論)を述べたい。
SEMを使って論文を書くことについて
小塩真司
正直なことを言うと,SEMや共分散構造分析を使って論文を書くことはそれほど多いわけではない。おそらく,自分がかかわる研究においてもっとも使う頻度が多い使用方法は,確認的因子分析であろう。その他の手法は,その研究の文脈に応じて使うことはあっても,無理に使ったという印象は少ない。また,おそらく探索的な検討が多いこともあるように思われる。
これまでSEMを用いた論文の査読などをしていて,いくつか気になることがあった。たとえば探索的な研究過程でSEMを用いること,それほど必然性が感じられないような場面で用いること,強固な目的があるわけではなく単にエクスキューズのためではないかと思わせる場面で使われていること,ここで使わないよりも使ったほうが採択率の上昇が見込めると考えているのだろうなという著者の意図が見えてしまうこと,などである。これらは決して糾弾されるような用いられ方ではない。現実として,特定の研究領域において新たな統計手法を用いることは,方法論上のアドバンテージと考えられて論文の採択率を高めるであろうし,研究者もそのことを念頭に分析をする可能性はある。
では,多くはない私自身の経験の中で,どのようにSEMを用いたのかを例示してみたい。第1に,確認的因子分析である。特に,複数の国を対象とした調査において,国をまたいでおおよそ同じ因子構造が見られるかどうかを多母集団解析で検討したことがある。この場合,測定不変性(measurement invariance)について検討することになる。そこには,因子と観測変数の配置が群間で等しいこと(configural invariance),因子負荷量が群間で等しいこと(metric invariance),観測変数の切片が群間で等しいこと(scalar invariance),観測変数の誤差分散が群間で等しいこと(residual invariance)という複数のレベルがあり,どのレベルまで満たされるかを検討することになる。第2に,縦断データの分析である。その中の1つは交差遅延効果モデル,もう1つは潜在成長曲線モデルである。縦断的なデータを分析する際に,SEMはその有用性を発揮するように思われる。
本報告では,査読経験と論文執筆経験の両面から,SEMの使用方法について考えてみたい。
自身の研究におけるSEMの適用を振り返って
鈴木雅之
発表者がSEMを適用した研究の多くは,大学院生時代に行われたものである。発表者が修士課程に入学した2008年の前後には,SEMを用いた研究が多くみられ,学部の授業ではSEMについて詳しく学ぶ機会がなかったことから,当時の発表者にとってSEMは最先端の分析手法であり,その可視性の高さから非常に魅力的なものにみえた。当時の自身の研究を振り返ってみると,「SEMを使ってみたい」という気持ちが先行しており,SEMのメリットを十分に活かした研究はできていなかったというのが,正直なところである。
発表者は大学院生時代,テストが学習動機づけや学習方略の使用に与える影響に関心を寄せていた。テストについては,内発的動機づけの低下や,目先のテストを乗り越えることだけを目的とした低次の学習が助長されるなど,その否定的な側面が強調されることが多い(e.g., Gipps, 1994)。一方で,テストが一種のペースメーカーとなることで計画的な学習が促進されたり,テストによる達成度の把握や学習改善が促進されたりするなど,テストには肯定的な側面もあることが示されてきた(e.g., Hong & Peng, 2008)。このように,テストの影響というのは一様ではなく,個人差がある。
テストの影響の個人差を説明する要因の1つとして,テストに対する学習者の認識(テスト観)に焦点が当てられてきた(e.g., Struyven et al., 2005)。つまり,あるテストが実施されることで学習者が受ける影響は,学習者がそのテストをどう捉えたかによって異なることが示唆されてきた。発表者は,テスト観が学習動機づけや学習方略の使用とどのような関連を持つかについて,質問紙調査や実験授業を行い,分析手法の1つとしてSEMを適用することで検討してきた。たとえば鈴木(2011)は,評価基準と学習改善のための指針を明確にしたフィードバックが学習動機づけと学習方略の使用に与える影響を,テスト観が媒介している可能性について検討した。また鈴木他(2015)は,縦断調査を行い,学習動機づけの変化とテスト観の関係について検討した。
本発表では,自戒の意味も込めて,これら一連の研究におけるSEMの適用を振り返りながら,SEMの適用方法について議論していきたい。
吉田寿夫
SEM(structural equation modeling:構造方程式モデリング)ないし共分散構造分析と呼ばれる統計手法は,この30年ほどの間,心理学を始めとする多くの研究領域において多用されてきた。それは,既存の多くの分析法を包括する大規模なものであるとともに,コンピュータなしでは行うことができない,ほとんどのユーザーにとって「計算過程がブラックボックス化している」と言えるであろうものである。
筆者は,論文の審査などを行うなかでSEMを用いている論文を多々読んできたが,率直に言って,「へえー」とか「なるほど」といった感覚を生じさせてくれる脱常識性が高いと判断されるものや,著書などで引用したり授業で紹介したりしようと思うものに遭遇したことがない。そして,そればかりか,おそらくはSEMの数学的な高度さに惑わされて,その力を過大視し,不当な結論を一人歩きさせていると言えるであろう状態が蔓延っているように感じている。
主たる問題は,多くの専門家が「SEMは基本的に因果関係を立証する力を有するものではない」ことについて警鐘を鳴らしてきたにもかかわらず,ユーザーの側がこのことをきちんと踏まえていないことにあると考えられる。そして,このことに関連して「予測と因果の混同」と言えるであろう事態が散見されるとともに,「適合度への過度の注目」,「適合度の評価における論理的必然性がないであろう基準の無批判な受け入れ」,「(重回帰分析におけるR2に相当する)説明力の非重視」,「パス係数の評価における統計的検定への過度の依拠」,「潜在変数間の関係の検討における希薄化の不適切な修正」,「測定の妥当性に関わる問題の軽視」,「個々人における心理過程の究明であることを踏まえない,個人間変動に基づく検討」などといった問題が指摘されてきた。
本シンポジウムでは,以上のような現状を踏まえ,SEMの有効性の過大視・不適切な適用や弊害の発生の抑制,適切な適用の促進といったことを目的として,現実の適用において散見される種々の問題事象を提示して,それらについて議論するとともに,SEMならではだと考えられる優れた適用例を提示して,SEMを用いることのメリットについて議論する。そして,そのうえで,適切な適用を促進し,不適切な適用を抑制するための方策について提言することができればと考えている。
SEMの営為の根本を見つめなおす
荘島宏二郎
SEMの最大の魅力は,何と言っても分析結果の視覚的了解性の高さである。端的に言って,パス図(path diagram)を用いたデータの要約結果,すなわち「情報の可視化(information visualization)」に優れている。SEM以前は,t検定・分散分析・回帰分析・因子分析が主な分析手法であったが,それらは,大抵,表によって結果が表示されていたため,パス図による現象の描写力の高さに多くの研究者が魅力を感じた。
また,計算機の高度化が手伝い,従来,理論的には考えられていたが,エンドユーザの計算機ではなかなか実現することが難しかったカテゴリカルデータ解析・多母集団分析・潜在クラス分析・マルチレベル分析・欠測データ分析などの「重たい」分析手法が,SEMというプラットフォームで花開いた。
今や,単なる「共分散構造」分析ではなく,それらの諸分析も含めての構造方程式モデリング(SEM)である。SEMに万能感を抱く研究者・分析者も多いのではないだろうか。
ほかにも,SEMの普及により,科学的意思決定がほとんどp値一辺倒だった時代から,適合度指標や自由度を総合的に見ていくという科学的態度を養うことに貢献したことも大きい。
反面,SEMの普及に伴い,肥大したSEMに対する信頼に基づく「因果に関する誤った言及(限定的に言及できる場合があるが)」や,SEMに関する不識・不案内に基づく「誤差間共分散の乱用」,「甘い適合度指標への過度の依存」,「パス図におけるトポロジカルな配置と印象操作」など,様々な改善すべき問題点がある。
さらに,SEMもまた方法論であることを考えると,本質的に複雑であり,超高次元多様体であるかのような現象のある一面を切り取ってくるものでしかない。当然,SEMの分析だけで現象を理解することはできず,他の方法と組み合わせて(方法論的多次元主義),現象を立体化しなくてはいけないが,SEMを過信する者ほど,往々にしてそういう態度は希薄である。
本報告では,心理統計学の専門家の観点から,統計分析という営為の本質に踏み込みつつ,「SEMが何をしているものか」ということについて試論(私論)を述べたい。
SEMを使って論文を書くことについて
小塩真司
正直なことを言うと,SEMや共分散構造分析を使って論文を書くことはそれほど多いわけではない。おそらく,自分がかかわる研究においてもっとも使う頻度が多い使用方法は,確認的因子分析であろう。その他の手法は,その研究の文脈に応じて使うことはあっても,無理に使ったという印象は少ない。また,おそらく探索的な検討が多いこともあるように思われる。
これまでSEMを用いた論文の査読などをしていて,いくつか気になることがあった。たとえば探索的な研究過程でSEMを用いること,それほど必然性が感じられないような場面で用いること,強固な目的があるわけではなく単にエクスキューズのためではないかと思わせる場面で使われていること,ここで使わないよりも使ったほうが採択率の上昇が見込めると考えているのだろうなという著者の意図が見えてしまうこと,などである。これらは決して糾弾されるような用いられ方ではない。現実として,特定の研究領域において新たな統計手法を用いることは,方法論上のアドバンテージと考えられて論文の採択率を高めるであろうし,研究者もそのことを念頭に分析をする可能性はある。
では,多くはない私自身の経験の中で,どのようにSEMを用いたのかを例示してみたい。第1に,確認的因子分析である。特に,複数の国を対象とした調査において,国をまたいでおおよそ同じ因子構造が見られるかどうかを多母集団解析で検討したことがある。この場合,測定不変性(measurement invariance)について検討することになる。そこには,因子と観測変数の配置が群間で等しいこと(configural invariance),因子負荷量が群間で等しいこと(metric invariance),観測変数の切片が群間で等しいこと(scalar invariance),観測変数の誤差分散が群間で等しいこと(residual invariance)という複数のレベルがあり,どのレベルまで満たされるかを検討することになる。第2に,縦断データの分析である。その中の1つは交差遅延効果モデル,もう1つは潜在成長曲線モデルである。縦断的なデータを分析する際に,SEMはその有用性を発揮するように思われる。
本報告では,査読経験と論文執筆経験の両面から,SEMの使用方法について考えてみたい。
自身の研究におけるSEMの適用を振り返って
鈴木雅之
発表者がSEMを適用した研究の多くは,大学院生時代に行われたものである。発表者が修士課程に入学した2008年の前後には,SEMを用いた研究が多くみられ,学部の授業ではSEMについて詳しく学ぶ機会がなかったことから,当時の発表者にとってSEMは最先端の分析手法であり,その可視性の高さから非常に魅力的なものにみえた。当時の自身の研究を振り返ってみると,「SEMを使ってみたい」という気持ちが先行しており,SEMのメリットを十分に活かした研究はできていなかったというのが,正直なところである。
発表者は大学院生時代,テストが学習動機づけや学習方略の使用に与える影響に関心を寄せていた。テストについては,内発的動機づけの低下や,目先のテストを乗り越えることだけを目的とした低次の学習が助長されるなど,その否定的な側面が強調されることが多い(e.g., Gipps, 1994)。一方で,テストが一種のペースメーカーとなることで計画的な学習が促進されたり,テストによる達成度の把握や学習改善が促進されたりするなど,テストには肯定的な側面もあることが示されてきた(e.g., Hong & Peng, 2008)。このように,テストの影響というのは一様ではなく,個人差がある。
テストの影響の個人差を説明する要因の1つとして,テストに対する学習者の認識(テスト観)に焦点が当てられてきた(e.g., Struyven et al., 2005)。つまり,あるテストが実施されることで学習者が受ける影響は,学習者がそのテストをどう捉えたかによって異なることが示唆されてきた。発表者は,テスト観が学習動機づけや学習方略の使用とどのような関連を持つかについて,質問紙調査や実験授業を行い,分析手法の1つとしてSEMを適用することで検討してきた。たとえば鈴木(2011)は,評価基準と学習改善のための指針を明確にしたフィードバックが学習動機づけと学習方略の使用に与える影響を,テスト観が媒介している可能性について検討した。また鈴木他(2015)は,縦断調査を行い,学習動機づけの変化とテスト観の関係について検討した。
本発表では,自戒の意味も込めて,これら一連の研究におけるSEMの適用を振り返りながら,SEMの適用方法について議論していきたい。