2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[3T1-GS-6] 言語メディア処理

2023年6月8日(木) 09:00 〜 10:40 T会場 (遠隔)

座長:梶原 智之(愛媛大学) [現地]

09:40 〜 10:00

[3T1-GS-6-03] テキストデータ拡張による感情分類精度向上の検討

〇宇田 陽斗1、松本 和幸1、吉田 稔1、北 研二1 (1. 徳島大学)

[[オンライン]]

キーワード:データ拡張、自然言語処理

昨今では,SNSを活用することで多種多様なテキストデータの収集が容易となった.しかし,SNS上のテキストデータには省略表現や口語表現などの短い文により,ラベル付けが難しいことや,短期間で大量のデータ収集が難しいことなどの問題点を持つ.これを解決するために機械学習向けの大規模かつ高品質なラベル付きのテキストデータを効率よく準備する手法として,データ拡張が有効である.本研究では,日本語テキストにデータ拡張を行うことにより,感情分類の学習精度の向上を目指す.データ拡張の手法としてEDAを用いた.EDAのテキスト操作に様々なモデルを用いることで,データ拡張の拡張幅を大きくした.また,意味的類似度とテキストの変化度によってデータ拡張で生成された拡張テキストを評価した.そして,閾値を決めることで学習に最適なデータを選んだ.データセットには,WRIMEコーパスを用いてることでラベルの信頼性を確保した.本発表では,データ拡張を用いた感情分類の学習精度の結果について報告する.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード