13:40 〜 14:00
[1N1-02] 訓練データの改ざんを考慮した機械学習手法
キーワード:人工知能、機械学習、改ざんされたデータ、ラベルノイズ
機械学習のための訓練データとしてビッグデータを用いることが増えている.しかし,ビッグデータのような大規模なデータが常に訓練データとして適切だとは限らない.特にSNSのようなWebサービスからデータを集める場合,サービスを利用する不特定多数の人間が間接的にデータを改ざん可能である.本研究では,訓練データの一部が改ざんされた環境であっても,改ざんのない場合に近い学習結果を得られるような学習手法の提案と有効性の検証を行った.この手法は,学習を2段階に分け,1段階目の学習結果を用いて訓練データの信頼度を推定することで,人間による改ざんされたデータの除外を補助するものである.