2020年度 人工知能学会全国大会(第34回)

講演情報

一般セッション

一般セッション » J-9 自然言語処理・情報検索

[1E5-GS-9] 自然言語処理・情報検索: 推定と分析

2020年6月9日(火) 17:20 〜 18:40 E会場 (jsai2020online-5)

座長:宮村祐一(有限責任監査法人トーマツ)

17:40 〜 18:00

[1E5-GS-9-02] 文連結型マルチソースニューラル機械翻訳の性能分析

〇磯部 僚也1、洪 博軒1、飯田 頌平1、魏 軼楨1、宇津呂 武仁1、永田 晶明2 (1. 筑波大学、2. NTT)

キーワード:ニューラル機械翻訳、マルチソース、文連結型、翻訳性能分析、三言語対訳

本論文では,三言語対訳コーパスが利用できる場合を対象として,これを有効活用する文連結型マルチソース翻訳手法を提案する.本手法においては,トークンを用いて複数の言語の原言語文を連結し,連結された二文を一文として扱い,翻訳モデルの訓練・評価を行う.このアプローチによれば,単エンコーダモデルによって2-to-1翻訳が実現可能となるため,マルチエンコーダの実装が不要となる.特許文を対象として,英語・中国語の二言語対訳文を入力して日本語へ翻訳するタスクにおいて本手法を適用した結果,英語文のみ,中国語文のみを入力して日本語へ翻訳する場合よりもBLEUを改善することができた.特に,カタカナ外来語・時制・助詞等,英語原言語文から日本語への翻訳においての方が翻訳精度が高くなる現象と,その逆に,日中二言語間で同一漢字が共有される漢字語のように,中国語原言語文から日本語への翻訳においての方が翻訳精度が高くなる現象の両方が観測され,英語・中国語の二言語対訳文を入力した場合にそれらの現象が相補的に改善されることにより翻訳精度が最大になることが判明した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード