15:40 〜 16:00
[2P3-02] 条件付き周辺尤度を用いたベイジアンネットワーク分類器学習
キーワード:ベイジアンネットワーク、分類問題、構造学習、識別モデル
ベイジアンネットワーク分類器(Bayesian Network Classifier: BNC)は仮定が少なく分類精度の高いモデルである.
BNCの構造学習スコアとして,Minimum Description Length(MDL)の対数尤度項を条件付き尤度に置き換えたConditional MDL(CMDL)が知られている.
CMDLスコアは条件付き周辺尤度(Conditional Marginal Likelihood: CML)の近似として解釈できるが,CMDLがCMLの高精度な近似である保証はなく,数学的なスコアの意味も明確ではない.
本論では,CMLを定義し,それを実時間で計算可能なように直接近似したapproximate CML(aCML)を学習スコアとして提案する.
aCMLはCMLの直接の近似であり,分類精度の向上が期待できる.
また,CMDLの計算時に行われる勾配法によるパラメータ推定が必要ないため,学習時間の大幅な減少が期待できる.
さらに,リポジトリデータを用いた実験により,CMDLよりもaCMLを用いたほうが学習時間が少ないことと,aCMLスコアの分類精度の有意性を示す.
BNCの構造学習スコアとして,Minimum Description Length(MDL)の対数尤度項を条件付き尤度に置き換えたConditional MDL(CMDL)が知られている.
CMDLスコアは条件付き周辺尤度(Conditional Marginal Likelihood: CML)の近似として解釈できるが,CMDLがCMLの高精度な近似である保証はなく,数学的なスコアの意味も明確ではない.
本論では,CMLを定義し,それを実時間で計算可能なように直接近似したapproximate CML(aCML)を学習スコアとして提案する.
aCMLはCMLの直接の近似であり,分類精度の向上が期待できる.
また,CMDLの計算時に行われる勾配法によるパラメータ推定が必要ないため,学習時間の大幅な減少が期待できる.
さらに,リポジトリデータを用いた実験により,CMDLよりもaCMLを用いたほうが学習時間が少ないことと,aCMLスコアの分類精度の有意性を示す.