15:40 〜 16:00
[1J4-OS-10b-03] 大規模言語モデルによる自由記述アンケート自動集約のための疑似訓練事例生成
キーワード:大規模言語モデル、自由記述アンケート、疑似データ、自動集約
自由記述回答を用いたアンケート調査は,調査対象における新たな価値や意見の
発見に貢献する重要な手法である.この自由記述回答の分析においては,回答中
の意見抽出や類似意見のクラスタリングなどの複数の人手作業が必要であり,一
般に大規模な回答データを対象とした分析には大きなコストがかかる.そこで本
論文では,大規模言語モデルを用いた自由記述回答中の意見抽出と類似意見のク
ラスタリングの自動化手法を提案する.提案手法においては,特に,大規模言語
モデルにより生成した自由記述回答の疑似データに対して,大規模言語モデル自
身によってアノテーションを行った疑似訓練事例を利用することにより,人手に
よるアノテーションを介さずに自由記述回答中の意見抽出と類似意見のクラスタ
リングを行う手法を提案する.実際に「新型コロナ不満アンケートデータ」の自
由記述回答を利用した実験の結果,提案手法によって,人手による分析を近似す
るに足る精度の分析を低コストかつ短時間で行えることを明らかに した.
発見に貢献する重要な手法である.この自由記述回答の分析においては,回答中
の意見抽出や類似意見のクラスタリングなどの複数の人手作業が必要であり,一
般に大規模な回答データを対象とした分析には大きなコストがかかる.そこで本
論文では,大規模言語モデルを用いた自由記述回答中の意見抽出と類似意見のク
ラスタリングの自動化手法を提案する.提案手法においては,特に,大規模言語
モデルにより生成した自由記述回答の疑似データに対して,大規模言語モデル自
身によってアノテーションを行った疑似訓練事例を利用することにより,人手に
よるアノテーションを介さずに自由記述回答中の意見抽出と類似意見のクラスタ
リングを行う手法を提案する.実際に「新型コロナ不満アンケートデータ」の自
由記述回答を利用した実験の結果,提案手法によって,人手による分析を近似す
るに足る精度の分析を低コストかつ短時間で行えることを明らかに した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。