2023年度 人工知能学会全国大会(第37回)

講演情報

ポスターセッション

一般セッション » ポスターセッション

[4Xin1] ポスターセッション2

2023年6月9日(金) 09:00 〜 10:40 X会場 (展示ホールB)

[4Xin1-62] 表データの注目すべき特徴について述べるテキストの生成

〇村山 友理1,2、石垣 達也2、上原 由衣2、宮尾 祐介3,2、高村 大也2、小林 一郎1,2 (1.お茶の水女子大学、2.産業技術総合研究所、3.東京大学)

キーワード:Data-to-Text、テキスト生成、データセット作成

本研究では,data-to-textのデータセットとして,表データの注目すべき特徴について述べるテキストを収集し,深層学習モデルによる生成に取り組む.表データの特徴として定義するのは,1) 数値の変化,2) 最も顕著な差異,3) グループ間の類似点/相違点,4) 例外,5) 変化なし,6) 最も高い/低い値,7) ランキングである.本研究の目的は,これらの7つの特徴のいずれかを捉えたテキストを用いてモデルを学習させることで,表層的な情報だけではなく,表データから読み取るべき情報を正確に記述するテキストを生成することである.LogicNLGデータセットの7,392の表データを基に,Amazon Mechanical Turkを通してテキストを収集する.また,作成したデータセットを用いてT5による実験を行い,生成結果を考察する.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード