2018年度人工知能学会全国大会(第32回)

講演情報

インタラクティブ発表

一般セッション » インタラクティブ

[4Pin1] インタラクティブ(2)

2018年6月8日(金) 09:00 〜 10:40 P会場 (4F エメラルドロビー)

09:00 〜 10:40

[4Pin1-25] 漢字分解したテキストによるニューラル機械翻訳

〇グプタ ビィシュウ1、中村 亮裕1、福田 治輝1、綱川 隆司1、狩野 芳伸1、西田 昌史1、西村 雅史1 (1. 静岡大学)

キーワード:ニューラル機械翻訳、漢字分解

ニューラル機械翻訳モデルでは扱える語彙サイズに制約があり、この課題に対処する方法としてサブワード単位、文字単位、あるいはバイト単位で処理する方法が提案されている。一方、日本語においては文字単位に分割しても漢字のバリエーションが多いために語彙サイズは比較的大きくなる。本研究では日本語テキストに対して漢字分解を適用することで語彙サイズの低減と漢字情報の維持を両立させることを目指すニューラル機械翻訳手法を提案し、評価実験を行った。