2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 2.機械学習

[2P3] 機械学習-分類問題

2018年6月6日(水) 15:20 〜 17:00 P会場 (4F エメラルドロビー)

座長:木村 圭吾(NEC)

16:40 〜 17:00

[2P3-05] 相対密度比を用いたマルチラベルロジスティック回帰について

〇岡部 格明1、土田 潤2、宿久 洋3 (1. 同志社大学大学院文化情報学研究科、2. 東京理科大学工学部、3. 同志社大学文化情報学部)

キーワード:不均衡データ、Binary relebance、F-measure

機械学習における分類問題のひとつにマルチラベル分類問題がある.マルチラベル分類問題は,対象ごとに付与されるであろうラベルを推定するような問題である.マルチラベル分類問題を解くための一つの方法にはBinary relevance法がある.これは,それぞれのラベルに対して2値分類問題を解く方法である.一般に,マルチラベル分類問題では,データの数に比べ,あるラベルが付与されている割合が極端に小さいという,ラベルのクラス不均衡の問題が起こりやすいと言われている.
そこで,本発表では,Binary relebance法による,近似されたmacro F-measureを重みとして用いた,ロジスティック回帰を提案する.この手法では,各ラベルの混同行列における関係から,相対F-measureを相対密度比によって近似する.それを誤差関数の重みとして用いることで,正解率だけでなく,F-measureを考慮した最大化問題を解くことになり,ラベルのクラス不均衡の問題を解決する.