16:40 〜 17:00
[2P3-05] 相対密度比を用いたマルチラベルロジスティック回帰について
キーワード:不均衡データ、Binary relebance、F-measure
機械学習における分類問題のひとつにマルチラベル分類問題がある.マルチラベル分類問題は,対象ごとに付与されるであろうラベルを推定するような問題である.マルチラベル分類問題を解くための一つの方法にはBinary relevance法がある.これは,それぞれのラベルに対して2値分類問題を解く方法である.一般に,マルチラベル分類問題では,データの数に比べ,あるラベルが付与されている割合が極端に小さいという,ラベルのクラス不均衡の問題が起こりやすいと言われている.
そこで,本発表では,Binary relebance法による,近似されたmacro F-measureを重みとして用いた,ロジスティック回帰を提案する.この手法では,各ラベルの混同行列における関係から,相対F-measureを相対密度比によって近似する.それを誤差関数の重みとして用いることで,正解率だけでなく,F-measureを考慮した最大化問題を解くことになり,ラベルのクラス不均衡の問題を解決する.
そこで,本発表では,Binary relebance法による,近似されたmacro F-measureを重みとして用いた,ロジスティック回帰を提案する.この手法では,各ラベルの混同行列における関係から,相対F-measureを相対密度比によって近似する.それを誤差関数の重みとして用いることで,正解率だけでなく,F-measureを考慮した最大化問題を解くことになり,ラベルのクラス不均衡の問題を解決する.