統計的尺度に基づく有害表現抽出手法の自動評価

荒田 真輝

10:30 〜 12:10

[3Rin2-38] 統計的尺度に基づく有害表現抽出手法の自動評価

〇荒田真輝¹、桝井文人¹、プタシンスキミハウ¹ (1. 北見工業大学)

キーワード：ネットいじめ、自然言語処理、自動評価

これまで，ネットいじめ対策支援を目的とした有害情報自動検出のために，カテゴリ別関連度最大化手法など様々な手法が提案されてきたが，時系列による適切な種単語の遷移への対応や個人名を含んだ書き込みの判定など様々な課題がある．本発表では自動評価尺度BLEUを利用した有害表現抽出手法における自動評価手法を提案する．本手法は，有害表現抽出手法が有害文書として判定した文書に対し，予め用意した有害文書集合との単語N-gramの一致度合いを計算し，対象文書を評価する．評価の結果，有害な書き込みに対して高いスコアを付与でき，一定の有効性が確認された．

講演情報

[3Rin2] インタラクティブセッション１

[3Rin2-38] 統計的尺度に基づく有害表現抽出手法の自動評価