データからの言語生成におけるスタイルと内容の分離

濵園 侑美; 上原 由衣; 石垣 達也; 宮尾 祐介; 高村 大也; 小林 一郎

[4Xin1-71] データからの言語生成におけるスタイルと内容の分離

〇濵園侑美^1,2、上原由衣²、石垣達也²、宮尾祐介^3,2、高村大也²、小林一郎^1,2 (1.お茶の水女子大学、2.産業技術総合研究所、3.東京大学)

キーワード：自然言語処理、言語生成、Data-to-text

非言語データを入力として文章を生成するdata-to-textのタスクでは，近年さまざまなデータを題材にend-to-end学習を行なうことで，高い生成性能を発揮している．Data-to-textにおいて，特に実世界で得られたデータと文章を用いる場合，入力のデータから目的の文章の属性を予測できず，目的の文章が生成できない場合があると指摘されている．このような予測不可能な属性を含むデータセットを用いる場合，データおよび文章の分析により，不足した属性を獲得し，入力として補うことで，文章の生成精度が向上し，さらにデータの内容をより正しく記述できることが確認されている．つまり，より正しくデータを記述するには，データの他に文章のスタイルを入力する必要があると言える．そこで，本研究ではDisentangledな表現学習による入力文章から文章の内容とスタイルを分離する手法をdata-to-textに適用し，入力データと文章から得られたスタイル表現による文章生成を検証する．さらに，文章から得られたスタイル表現を分類することで，入力データから得られない文章の属性を抽出する方法について検証する．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4Xin1] ポスターセッション2

[4Xin1-71] データからの言語生成におけるスタイルと内容の分離

パスワード