日本教育心理学会第58回総会

講演情報

自主企画シンポジウム

ベイズ統計学と歩む,これからの心理学研究

研究仮説が正しい確率と階層モデリングを用いたアプローチ

2016年10月10日(月) 10:00 〜 12:00 54会議室A (5階54会議室A)

企画:長尾圭一郎(早稲田大学大学院)
司会:豊田秀樹(早稲田大学)
話題提供:長尾圭一郎(早稲田大学大学院), 久保沙織(早稲田大学), 秋山隆(早稲田大学), 磯部友莉恵#(早稲田大学大学院), 吉上諒#(早稲田大学大学院)
指定討論:繁桝算男(帝京大学)

10:00 〜 12:00

[JG04] ベイズ統計学と歩む,これからの心理学研究

研究仮説が正しい確率と階層モデリングを用いたアプローチ

長尾圭一郎1, 豊田秀樹2, 久保沙織3, 秋山隆4, 磯部友莉恵#5, 吉上諒#6, 繁桝算男7 (1.早稲田大学大学院, 2.早稲田大学, 3.早稲田大学, 4.早稲田大学, 5.早稲田大学大学院, 6.早稲田大学大学院, 7.帝京大学)

キーワード:ベイズ統計学, 研究仮説が正しい確率, 階層モデリング

企画趣旨
 近年,ベイズ統計学はその方法論を拡大し,これまでの主流であった頻度論による伝統的統計学を凌駕する勢いをみせている。心理学をはじめとした社会科学の研究領域でも,その重要性はこれからますます高まることが予想される。本発表では,伝統的統計学では数学的障壁に阻まれ,これまで利用される機会が少なかった発展的な確率分布 (Ⅰ部),適用分野が多岐に渡る汎用的解析ツール (Ⅱ部),心理学における有用なモデル (Ⅲ部) をベイズ統計学による分析例を通して紹介する。また,Ⅱ部とⅢ部で導入されるモデルのグラフィカルな表現方法についても説明する。研究仮説が正しい確率と階層モデリングを用いたベイズ的アプローチはこれからの心理学研究の発展に寄与することが期待される。
話題提供
Ⅰ部 発展的な確率分布
Ⅰ.1 ワイブル分布
 本発表では,実データの分析例を通してワイブル分布に関するベイズ推定を紹介する。ワイブル分布は,元々物体の破壊強度が従う分布として提案された。現在では故障時間や寿命など,さまざまな社会現象がワイブル分布に従うことが知られている。ワイブル分布の形状母数mがとる値によって,故障のタイプは3つに分かれる。1つ目が時間と共に故障率が低くなる「初期故障型」,2つ目が時間と共に故障率が高くなる「摩耗故障型」,3つ目が時間に関係なく故障率が一定となる「偶発故障型」である。ここでは2014年の同居期間別の離婚件数のデータを用い,リサーチクエスチョンの考察を行う。具体的には1)2014年に離婚した夫婦の平均的な同居期間,2)2014年の離婚の傾向は3つの故障モデルのどれに分類できるのか,3)「結婚4~5年目が離婚しやすい時期である」という仮説が正しい確率,の3つを扱う。
(磯部)
Ⅰ.2 階層ベイズ法による二項分布モデルとベータ二項分布モデル
 コイントスをした場合に表が出る回数は二項分布に従う。しかし同じカウントデータでも各都道府県の待機児童数はそれぞれ同一の二項分布に従うとは限らない。なぜなら各都道府県によって待機児童になる確率が異なるからである。本発表では待機児童数のように観測対象ごとに生起確率の異なるベルヌイ試行から得られたデータを扱い,このようなデータを分析するためのモデルを2つ紹介する。1つは階層ベイズによる二項分布を用いたモデルである。このモデルは階層ベイズ法によって観測対象ごとの生起確率の異質性を考慮している。分析例では都道府県ごとの待機児童に関するデータを用いて都道府県ごとの待機児童になる確率や全体の平均的な待機児童になる確率を推定している。もう1つのモデルはベータ二項分布を用いたモデルである。このモデルの分析例ではネズミの胎児死亡に関するデータを扱い,観測対象群ごとの死亡率の差の推定やその大小に関する仮説が正しい確率の推定を行う。 (吉上)
Ⅱ部 汎用的解析ツール
Ⅱ.1 トピックモデル
 トピックモデルは,文書データを対象とした自然言語処理をはじめ,画像データ,音声データ,購買記録データ等にも適用され,情報検索や協調フィルタリングに応用されるなど,近年注目を集めている分析手法の1つである。トピックモデルを用いることで,大量の文書データを定量的に分析し,そこに潜む意味を明らかにすることができる。トピックモデルでは,それぞれの文書が複数のトピックを持つと仮定し,文書ごとに異なるトピック分布に従って単語レベルでトピックが選択され,そのトピックに固有の単語分布に従って個々の単語が生成されるという文書生成過程を表現している。このとき,トピック分布の事前分布として,ディリクレ分布を仮定する (Latent Dirichlet Allocation, LDA)。ここでは,米国AP通信の記事データを用いて,LDAによるトピックモデルの分析例を示す。 (久保)
Ⅱ.2 隠れマルコフモデル
 隠れマルコフモデルは遷移する離散潜在変数の状態によって,観測される事象の確率分布が異なる確率モデルを表現する。直接観測できない潜在変数の状態を推測できることから,隠れマルコフモデルは心理学研究における観察者が直接にはわからない対象者の心理状態の推測に応用が期待される。本発表では,隠れマルコフモデルの基礎となるマルコフ連鎖の概念に始まり,カテゴリカル分布を利用した教師あり学習モデル,前向きアルゴリズムを用いた半教師なしアルゴリズムを紹介する。また,隠れマルコフモデルの最終的な目的である状態遷移の系列を復元する方法としてビタビ・アルゴリズムのベイズ表現を紹介する。分析例として,共働きである夫婦に関して,奥さんの用意する夕食の献立から,奥さんのその日の疲労度を推測する問題を考える。 (長尾)
Ⅱ.3 リンク関数
 例えば,xを説明変数,yを目的変数とした単回帰分析をベイズの枠組みで表現するとき,yがもし平均μ,標準偏差σの正規分布に従っていると仮定できるならば,その平均μが単回帰モデルによって生成されていると考える。これはすなわち,目的変数について将来新たなデータを取得した場合,当該データがその期待値(予測値)の周りで正規分布していると仮定していることと同じである。しかしながら,目的変数yが条件付き正規分布に従っていると仮定できない場合には,回帰モデルをはじめとした線形構造をそのまま適用することはできない。そこで,リンク関数と呼ばれる変換を用いることで,条件付き正規分布以外に従うデータに対しても,線形構造によって説明や予測のためのモデルを構築することが可能となる。本発表では,目的変数に相当するデータが,期待値で条件付けた際にベルヌイ分布,ポアソン分布,負の2項分布に従っている場合のそれぞれについて,リンク関数を利用して線形構造を導入する方法を紹介する。 (秋山)
Ⅲ部 心理学における有用なモデル
Ⅲ.1 信号検出理論
 信号検出理論は,心理物理学的実験において,刺激を正しく判別する検出力および,被験者の判断基準や反応バイアスを評価するために用いられる。刺激の有無を判断する試行における被験者の反応結果は,刺激呈示の有無と,被験者の判断(Yes-No) とで2×2のクロス集計表にまとめられる。信号検出理論では,被験者の心理量がある一定の値以上となったときに信号がある(Yes)と判断すると考え,これら4パタンそれぞれの反応が得られる確率を,ノイズ分布と信号+ノイズ分布という2つの分布を仮定することで説明している。ここでは,信号検出理論の基本的なモデルに加えて,検出力と反応バイアスを個人ごとに推定するための階層ベイズモデルを導入し,単語の再認課題の実験データを用いた分析例を示す。
(久保)
Ⅲ.2 BARTモデル
 リスクの認知の有無とは無関係に,リスクを敢行する行動のことを,リスクテイキングという。リスクテイキング行動の個人差を,行動パフォーマンスの観点から検討するための一手法として,BART (Balloon Analogue Risk Task) がある。BARTはPC画面上で風船を膨らませるという課題であり,被験者は各試行において風船を膨らませるか,風船の大きさに応じた金額を獲得するかを選択する。風船が大きくなるほど得られる金額が増加するが,ある大きさを超えると風船は破裂する。破裂した場合,その試行で得られる金額はゼロとなる。被験者はその条件の中でなるべく多くの金額を獲得できるよう課題を遂行する。本発表では,リスクテイキング傾向を表す母数と,行動の一貫性を表す母数によって構成される,Ravenzwaaij(2011)によって提案されたBARTモデルを紹介する。
(秋山)
Ⅲ.3 アイオワ・ギャンブリング課題
 アイオワ・ギャンブリング課題(IGT)は意思決定のプロセスを評価する心理実験として知られている。IGTを利用することで,アスペルガー症候群やアルツハイマー患者といった臨床群における意思決定能力の欠如の度合いを評価できる。実験では,被験者に並んだ4つのカードのデッキから1枚のカードを引く試行を行ってもらう。カードの裏には報酬額と損失額が記載されており,デッキごとに得られる純利益の期待値は異なる。被験者は試行を繰り返すことで,望まれるデッキを選択する方略を獲得する。ここでは,被験者の探索行動と期待値に基づく選択を表現するモデルとして「期待数価モデル」を取り上げる。損失への敏感度,更新比率,選択の一貫性といった特性値をベイズ推定することで課題に対する被験者の傾向を解釈することができる。 (長尾)