[PD68] DINAモデルの再定式化とEMアルゴリズムの直接的導出
キーワード:認知診断モデル, DINAモデル, EMアルゴリズム
問題と目的
認知診断モデルは新しい教育測定モデルであり,テストから解答者の認知能力の強み弱みを推定することができる(山口・岡田, 2017)。なかでも,DINAモデル(deterministic input noisy and gate model)は最も基本的な認知診断モデルであり,研究が盛んに行われている。de la Torre(2009)はDINAモデルにおけるパラメタの最尤推定値を得るアルゴリズムを示した。しかしながら,de la Torre(2009)は対数周辺尤度を直接微分して,EMアルゴリズムを構成しており,EMアルゴリズムがどのように構成されるのか明らかではない。これは,MAP推定値を得るアルゴリズムへの拡張が行いにくく問題がある。そこで本研究では,新たに潜在変数を明示的に導入することで,DINAモデルの再定式化,完全データの尤度を示し,より直接的にEMアルゴリズムを導出する。
DINAモデル
認知診断モデルでは,問題正答に必要な認知要素としてアトリビュートが設定される。アトリビュートは一般に0であれば未習得,1であれば習得を表す潜在変数であり,複数のアトリビュートの習得・未習得の組合せを考える。このアトリビュート習得パタンをα_l=[α_l1,⋯,α_lk,⋯,α_lK ]^Tとする。k(=1,⋯,K)はアトリビュートの番号であり,(l=1,⋯,L=2^K)はアトリビュート習得パタンを示す番号である。一方,Q行列は項目とアトリビュートの間の関連を示す行列であり,q_jk=1であれば,項目j(=1,⋯,J)にアトリビュートkが必要,そうでなければ0を示すように,分析者が作成する。これらを用いて,η_lj=∏_k▒α_lk^(q_jk ) という,理想反応が定義される。理想反応はアトリビュート習得パタンlが項目jに必要なアトリビュートをすべて習得しているならば1,そうでなければ0である
このη_ljを用い,DINAモデルの項目反応関数は
P(x_ij,z_il│s_j,g_j,π_l )=
[〖π_l ((1-s_j )^(η_lj ) g_j^(1-η_lj ) )〗^(x_ij ) (〖s_j〗^(η_lj ) (1-g_j )^(1-η_lj ) )^(1-x_ij ) ]^(z_il )
と定義される。ここで,x_ijは解答者i(=1,⋯,I)の項目jへの反応で,正答ならば1,誤答ならば0である。z_ilは解答者iがアトリビュート習得パタンlであれば1を示し,そうでなければ0を示す潜在変数であり,∑_l▒z_il =1を満足する。さらに,2つの項目パラメタは,s_j=P(x_lj=0|η_lj=1)とg_j=P(x_lj=1|η_lj=0)であり,s_jは項目jに正答に必要なアトリビュートを全て習得しているパタンlに属する人が誤答する確率で,g_jは項目jに正答に必要なアトリビュートが一つ以上足りないパタンlに属する人が誤答する確率と定義される。π_lはアトリビュート習得パタンの混合比率を表すパラメタで∑_l▒π_l =1である。
以上から,完全データの尤度は
P(X,Z│s,g,π)=∏_i▒∏_j▒∏_l▒〖P(x_ij,z_il│s_j,g_j,π_l ) 〗
となる。重要なのは,個人のアトリビュート習得パタンを指し示す変数z_ilを明示的に組み込んだことである。これにより,EMアルゴリズムで期待値計算をすべき変数がわかりやすく示され,EMアルゴリズムを容易に導出可能となる。
EMアルゴリズム
EMアルゴリズムは,現在のパラメタのもとで,所属クラスを示す,z_ilの期待値の計算し(E-step),対数完全尤度のZの事後分布での期待値をパラメタで最大化すればよい(M-step)。
E-step:,z_ilの期待値の計算
γ(z_il )=E_(P(z_il│x_i,Θ^old ) ) [z_il ]
=(π_l ∏_j▒〖((1-s_j )^(η_lj ) g_j^(1-η_lj ) )^(x_ij ) (〖s_j〗^(η_lj ) (1-g_j )^(1-η_lj ) )^(1-x_ij ) 〗)/(∑_l▒(π_l ∏_j▒〖((1-s_j )^(η_lj ) g_j^(1-η_lj ) )^(x_ij ) (〖s_j〗^(η_lj ) (1-g_j )^(1-η_lj ) )^(1-x_ij ) 〗) )
ただし, Θ^old=[s^old,g^old,π^old]で,常識右辺のパラメタは現在のパラメタ値とするが,表記の簡略化のために,“old”の添字を省略した。
M-step:パラメタを更新する。
π_l^new=(∑_i▒γ(z_il ) )/I
s_j^new=(∑_i▒〖∑_l▒γ(z_il ) η_lj (1-x_ij ) 〗)/(∑_i▒〖∑_l▒γ(z_il ) η_lj 〗)
g_j^new=(∑_i▒〖∑_l▒γ(z_il ) 〖(1-η〗_lj)x_ij 〗)/(∑_i▒〖∑_l▒γ(z_il ) 〖(1-η〗_lj)〗)
以上の2ステップを収束するまで反復する。このように,z_ilを導入することで,EMアルゴリズムの導出が容易に行なうことができた。
引用文献
de la Torre, J. (2009). DINA model and parameter estimation: A didactic. Journal of Educational and Behavioral Statistics, 34, 115-130.
山口一大・岡田謙介 (2017). 近年の認知診断モデルの展開. 44, 181-198.
付 記:本研究は特別研究員奨励費18J01312の助成を受けた。
認知診断モデルは新しい教育測定モデルであり,テストから解答者の認知能力の強み弱みを推定することができる(山口・岡田, 2017)。なかでも,DINAモデル(deterministic input noisy and gate model)は最も基本的な認知診断モデルであり,研究が盛んに行われている。de la Torre(2009)はDINAモデルにおけるパラメタの最尤推定値を得るアルゴリズムを示した。しかしながら,de la Torre(2009)は対数周辺尤度を直接微分して,EMアルゴリズムを構成しており,EMアルゴリズムがどのように構成されるのか明らかではない。これは,MAP推定値を得るアルゴリズムへの拡張が行いにくく問題がある。そこで本研究では,新たに潜在変数を明示的に導入することで,DINAモデルの再定式化,完全データの尤度を示し,より直接的にEMアルゴリズムを導出する。
DINAモデル
認知診断モデルでは,問題正答に必要な認知要素としてアトリビュートが設定される。アトリビュートは一般に0であれば未習得,1であれば習得を表す潜在変数であり,複数のアトリビュートの習得・未習得の組合せを考える。このアトリビュート習得パタンをα_l=[α_l1,⋯,α_lk,⋯,α_lK ]^Tとする。k(=1,⋯,K)はアトリビュートの番号であり,(l=1,⋯,L=2^K)はアトリビュート習得パタンを示す番号である。一方,Q行列は項目とアトリビュートの間の関連を示す行列であり,q_jk=1であれば,項目j(=1,⋯,J)にアトリビュートkが必要,そうでなければ0を示すように,分析者が作成する。これらを用いて,η_lj=∏_k▒α_lk^(q_jk ) という,理想反応が定義される。理想反応はアトリビュート習得パタンlが項目jに必要なアトリビュートをすべて習得しているならば1,そうでなければ0である
このη_ljを用い,DINAモデルの項目反応関数は
P(x_ij,z_il│s_j,g_j,π_l )=
[〖π_l ((1-s_j )^(η_lj ) g_j^(1-η_lj ) )〗^(x_ij ) (〖s_j〗^(η_lj ) (1-g_j )^(1-η_lj ) )^(1-x_ij ) ]^(z_il )
と定義される。ここで,x_ijは解答者i(=1,⋯,I)の項目jへの反応で,正答ならば1,誤答ならば0である。z_ilは解答者iがアトリビュート習得パタンlであれば1を示し,そうでなければ0を示す潜在変数であり,∑_l▒z_il =1を満足する。さらに,2つの項目パラメタは,s_j=P(x_lj=0|η_lj=1)とg_j=P(x_lj=1|η_lj=0)であり,s_jは項目jに正答に必要なアトリビュートを全て習得しているパタンlに属する人が誤答する確率で,g_jは項目jに正答に必要なアトリビュートが一つ以上足りないパタンlに属する人が誤答する確率と定義される。π_lはアトリビュート習得パタンの混合比率を表すパラメタで∑_l▒π_l =1である。
以上から,完全データの尤度は
P(X,Z│s,g,π)=∏_i▒∏_j▒∏_l▒〖P(x_ij,z_il│s_j,g_j,π_l ) 〗
となる。重要なのは,個人のアトリビュート習得パタンを指し示す変数z_ilを明示的に組み込んだことである。これにより,EMアルゴリズムで期待値計算をすべき変数がわかりやすく示され,EMアルゴリズムを容易に導出可能となる。
EMアルゴリズム
EMアルゴリズムは,現在のパラメタのもとで,所属クラスを示す,z_ilの期待値の計算し(E-step),対数完全尤度のZの事後分布での期待値をパラメタで最大化すればよい(M-step)。
E-step:,z_ilの期待値の計算
γ(z_il )=E_(P(z_il│x_i,Θ^old ) ) [z_il ]
=(π_l ∏_j▒〖((1-s_j )^(η_lj ) g_j^(1-η_lj ) )^(x_ij ) (〖s_j〗^(η_lj ) (1-g_j )^(1-η_lj ) )^(1-x_ij ) 〗)/(∑_l▒(π_l ∏_j▒〖((1-s_j )^(η_lj ) g_j^(1-η_lj ) )^(x_ij ) (〖s_j〗^(η_lj ) (1-g_j )^(1-η_lj ) )^(1-x_ij ) 〗) )
ただし, Θ^old=[s^old,g^old,π^old]で,常識右辺のパラメタは現在のパラメタ値とするが,表記の簡略化のために,“old”の添字を省略した。
M-step:パラメタを更新する。
π_l^new=(∑_i▒γ(z_il ) )/I
s_j^new=(∑_i▒〖∑_l▒γ(z_il ) η_lj (1-x_ij ) 〗)/(∑_i▒〖∑_l▒γ(z_il ) η_lj 〗)
g_j^new=(∑_i▒〖∑_l▒γ(z_il ) 〖(1-η〗_lj)x_ij 〗)/(∑_i▒〖∑_l▒γ(z_il ) 〖(1-η〗_lj)〗)
以上の2ステップを収束するまで反復する。このように,z_ilを導入することで,EMアルゴリズムの導出が容易に行なうことができた。
引用文献
de la Torre, J. (2009). DINA model and parameter estimation: A didactic. Journal of Educational and Behavioral Statistics, 34, 115-130.
山口一大・岡田謙介 (2017). 近年の認知診断モデルの展開. 44, 181-198.
付 記:本研究は特別研究員奨励費18J01312の助成を受けた。