4:00 PM - 4:20 PM
[2Q4-J-2-03] Exact Learning Augmented Naive Bayes Classifier
Keywords:Bayesian networks, classifiers, probabilistic graphical models
ベイジアンネットワーク分類器(Bayesian Network Classifier: BNC)は離散変数を扱う高精度の分類器として知られている.
BNCは生成モデルよりも識別モデルの方が分類精度が高いことが先行研究で報告されてきた.
しかし,なぜ識別モデルの方が分類精度が高いかという理由については未だ明らかにされていない.
本論では,まず識別モデルとしてのBNCと厳密に学習した生成モデルとしてのBNCの分類精度の比較実験を行なった.
その結果,生成モデルはサンプルサイズが大きい時は識別モデルより分類精度が高かった.
一方で,サンプルサイズが小さい場合は,生成モデルでは目的変数の親変数が増加してしまい,パラメータ数の指数的増加によって分類精度が識別モデルよりも著しく低下していた.
そこで,本論では,目的変数が親変数を持たないANB構造を制約とした,生成モデルとしてのBNCの厳密学習手法を提案する.
リポジトリデータセットを用いた実験により,提案手法が従来の識別モデルのBNCよりも分類精度が有意に高いことを示す.
BNCは生成モデルよりも識別モデルの方が分類精度が高いことが先行研究で報告されてきた.
しかし,なぜ識別モデルの方が分類精度が高いかという理由については未だ明らかにされていない.
本論では,まず識別モデルとしてのBNCと厳密に学習した生成モデルとしてのBNCの分類精度の比較実験を行なった.
その結果,生成モデルはサンプルサイズが大きい時は識別モデルより分類精度が高かった.
一方で,サンプルサイズが小さい場合は,生成モデルでは目的変数の親変数が増加してしまい,パラメータ数の指数的増加によって分類精度が識別モデルよりも著しく低下していた.
そこで,本論では,目的変数が親変数を持たないANB構造を制約とした,生成モデルとしてのBNCの厳密学習手法を提案する.
リポジトリデータセットを用いた実験により,提案手法が従来の識別モデルのBNCよりも分類精度が有意に高いことを示す.