2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-10 大規模言語モデルとデータサイエンス

[1J4-OS-10b] 大規模言語モデルとデータサイエンス

2024年5月28日(火) 15:00 〜 16:40 J会場 (43会議室)

オーガナイザ:砂山 渡(滋賀県立大学)、森 辰則(横浜国立大学)、高間 康史(東京都立大学)、笹嶋 宗彦(兵庫県立大学)、西原 陽子(立命館大学)

15:40 〜 16:00

[1J4-OS-10b-03] 大規模言語モデルによる自由記述アンケート自動集約のための疑似訓練事例生成

〇長谷川 遼1、銭本 友樹1、宇津呂 武仁1、西崎 博光2、吉岡 真治3、神門 典子4 (1. 筑波大学、2. 山梨大学、3. 北海道大学、4. 情報学研究所)

キーワード:大規模言語モデル、自由記述アンケート、疑似データ、自動集約

自由記述回答を用いたアンケート調査は,調査対象における新たな価値や意見の
発見に貢献する重要な手法である.この自由記述回答の分析においては,回答中
の意見抽出や類似意見のクラスタリングなどの複数の人手作業が必要であり,一
般に大規模な回答データを対象とした分析には大きなコストがかかる.そこで本
論文では,大規模言語モデルを用いた自由記述回答中の意見抽出と類似意見のク
ラスタリングの自動化手法を提案する.提案手法においては,特に,大規模言語
モデルにより生成した自由記述回答の疑似データに対して,大規模言語モデル自
身によってアノテーションを行った疑似訓練事例を利用することにより,人手に
よるアノテーションを介さずに自由記述回答中の意見抽出と類似意見のクラスタ
リングを行う手法を提案する.実際に「新型コロナ不満アンケートデータ」の自
由記述回答を利用した実験の結果,提案手法によって,人手による分析を近似す
るに足る精度の分析を低コストかつ短時間で行えることを明らかに した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード