[4Xin2-12] テキスト正規化による日本語感情分析の性能改善
キーワード:感情分析、テキスト正規化、WRIME
本研究では,日本語のSNS投稿テキストを対象とする感情極性分類に取り組む.SNSから収集されたテキストには,発音の崩れや誤字脱字をはじめとする日本語の表記の崩れや,ネットスラングのようなSNS特有の造語など,様々なノイズが含まれる.このようなテキストの多様性が感情分析モデルの性能に悪影響を及ぼす可能性があるため,本研究ではテキスト正規化によって感情分析の性能改善を試みる.さらに,同義語集合の高頻度な表現への統一,誤字脱字の修正,常体敬体などの文末表現の統一など,テキスト正規化に含まれる様々な編集操作について詳細に分析し,どの種類の正規化が感情分析の性能改善に貢献するのかを明らかにする.SNS投稿テキストを対象とするWRIMEコーパスにおける感情極性分類の評価実験の結果,テキスト正規化によって日本語感情分析の性能を改善できることを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。