[4Rin1-44] ニューラル機械翻訳における出力文数の制御
キーワード:機械翻訳
NHKでは、英語ニュースの制作を支援するため、日英機械翻訳技術の研究開発を進めている。NHKの日本語ニュースは文長が長い傾向があるが、英語ニュースでは長い文は使われず、日本語の一文は英語の複数文に分けて翻訳される傾向がある。そのため、日英機械翻訳の出力には、意味の正確さ以外に英語の各文が適切な長さに分割して翻訳する必要がある。 本稿では、NHKのニュースを対象とした日英翻訳において、ニューラル機械翻訳(NMT)で出力の文数を制御する手法を提案する。提案手法は、学習時に目的言語の文数を示すタグを原言語文に付与してNMTのモデルを学習し、翻訳時に出力文数を示すタグを入力文に付与して翻訳することで出力文数を制御する。 ニュースの日英対訳文を用いて評価実験を実施し、参照訳の文数を表すタグを用いて制御した提案手法で96.6%の精度が得られた。タグを使わずに翻訳した場合の精度は60.4%であり、本手法が出力の文数の制御に効果があることを確認した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。