10:30 〜 12:10
[3Rin2-34] DAMを用いた文レベルのアライメントによるテキスト平易化コーパス構築手法の提案
キーワード:テキスト平易化、コーパス、アライメント
テキスト平易化とは、与えられた文章を分かりやすい表現に置き換えるタスクである。テキスト平易化により、外国人や初学者に対する学習支援が可能になる。現在、機械翻訳などの系列変換タスクでは、大規模なパラレルコーパスに基づくseq2seqモデルを用いた研究が進められており、テキスト平易化に対しても、同様の手法による性能向上が期待される。こうしたモデルを生成するためには、文レベルのパラレルコーパスが必要となる。しかしながら、現状文レベルのアライメントが取られたテキスト平易化のためのコーパスは構築されていない。そこで、本研究では、ニューラルネットワークに基づく含意関係認識モデルを用いて文間のアライメントをアノテーションすることにより、自動的にテキスト平易化のためのコーパスを構築することを提案する。事前に人手でアノテーションしたデータセットを用いた実験では、含意関係認識モデルが従来提案されていたアライメント手法よりも高い性能を示した。