16:00 〜 16:20
[2H4-E-2-03] 潜在的な談話構造を捉えたレビュー文書の教師なしヘッドライン生成
キーワード:ヘッドライン生成、談話構造、教師なし学習
近年、大量の参照要約を用いたヘッドライン生成モデルが成果を上げている。一方で、大量の参照要約を有する文書は稀であり、学習後のモデルはドメイン間で転用できない場合が多い。本稿では上記問題に着眼し、レビュー文書を対象に、教師なし学習によるヘッドライン生成モデルを提案する。具体的には、レビュー文書について、ヘッドラインが根、本文中の各文が各ノードを構成し、子の文が親の文を詳述する談話構造木として表現されることを仮定する。子の文から親の文を再帰的に推定することで、文書の談話構造と言語モデルを獲得し、その帰結としてレビュー文書全体の要約となるヘッドラインを生成する。実際のレビュー文書を用いたヘッドライン生成精度評価では、比較的長文の文書において、教師有りモデルに対し競合する精度を確認した。また、学習の過程で得られた談話構造木は子の文が親の文を詳述する関係を有し、生成されたヘッドラインはレビュー文書全体を抽象化していることが確認された。