16:20 〜 16:40
[2F4-OS-5b-04] Filtering of Impertinent Remarks using distributed expression
キーワード:不適切な投稿、doc2vec、文書類似度
本稿では,投稿文書の分散表現を用いたフィルタリング手法を提案する.近年,オンライン上での議論が活発化している.ただし,これらの議論には無関係のスパムなどの有害なコンテンツが多数あり,また相手を侮辱したり差別したりする激しい発言がある.従って,不適切な発言を削除して安全にオンラインユーザーが参加できる議論環境を構築することが必要になる.不適切な発言を削除するには,文書の意味を理解し分類することが必要である.本稿では,doc2vecを文書のベクトル化,ELMoを単語のベクトル化に用い,ベクトル化された文書を文書類似度計算とディープニューラルネットワーク(DNN)を用いてフィルタを構築した.評価実験では提案手法が高い精度で不適切文書を分類できたことを示す.