表データの注目すべき特徴について述べるテキストの生成

村山 友理; 石垣 達也; 上原 由衣; 宮尾 祐介; 高村 大也; 小林 一郎

[4Xin1-62] 表データの注目すべき特徴について述べるテキストの生成

〇村山友理^1,2、石垣達也²、上原由衣²、宮尾祐介^3,2、高村大也²、小林一郎^1,2 (1.お茶の水女子大学、2.産業技術総合研究所、3.東京大学)

キーワード：Data-to-Text、テキスト生成、データセット作成

本研究では，data-to-textのデータセットとして，表データの注目すべき特徴について述べるテキストを収集し，深層学習モデルによる生成に取り組む．表データの特徴として定義するのは，1) 数値の変化，2) 最も顕著な差異，3) グループ間の類似点/相違点，4) 例外，5) 変化なし，6) 最も高い/低い値，7) ランキングである．本研究の目的は，これらの7つの特徴のいずれかを捉えたテキストを用いてモデルを学習させることで，表層的な情報だけではなく，表データから読み取るべき情報を正確に記述するテキストを生成することである．LogicNLGデータセットの7,392の表データを基に，Amazon Mechanical Turkを通してテキストを収集する．また，作成したデータセットを用いてT5による実験を行い，生成結果を考察する．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4Xin1] ポスターセッション2

[4Xin1-62] 表データの注目すべき特徴について述べるテキストの生成

パスワード