18:10 〜 18:30
[2L6-OS-19b-03] 分類器出力の確信度エントロピーを用いたConfident Learningの提案
キーワード:半教師あり学習、計測インフォマティクス、機械学習
ノイズの多いラベルをもつデータセットに対しては、損失関数の工夫などによるモデル中心のアプローチと、ラベルの誤りを判定するデータ中心のアプローチであるConfident Learning(以下CL)が存在する。CLにおける問題設定は、あるクラスに属する事例のラベルが別のクラスに誤ってラベル付けされている例を見つけることであり、ラベル誤りは個々のデータによらずデータの属するクラスにのみ依存することが仮定されている。しかし現実の問題では、どのクラスにも属さないデータにクラスのラベルが誤って付されている状況も存在し、この場合CLにおける問題設定や仮定が成立しない。本研究では、分類器が出力する各ラベルの確信度のエントロピーに閾値を設け、閾値を越えた事例をノイズラベル事例として新たに分類器を学習し、学習した分類器を通したテストデータの混同行列を評価することにより閾値をサーチする手法を提案する。また実データへの適用例としてナノポアデバイスによるウイルス検出の問題を取り上げる。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。