[4Xin2-93] 会議翻訳における文脈情報を考慮した少数ショット学習
キーワード:機械翻訳、少数ショット学習、文脈翻訳
ビジネス会議では,異言語話者間で情報交換が行われることがある.このような状況での円滑なコミュニケーションを促進するため,話し言葉を対象とした機械翻訳(MachineTranslation, MT)のニーズが高まっている。話し言葉は指示代名詞や省略表現が多い,固有名詞や固有表現が多いといった傾向があるため, 話の流れ(文脈情報) を考慮して翻訳(文脈翻訳)を行う必要がある.本研究では,ビジネス会議を想定し,日 ↔ 英の翻訳を対象に,大規模言語モデル (Large Language Model, LLM)を用いた文脈翻訳についての研究を行う.実際の会議に即した評価を行うため,我々は実際の会議音声データの書き起こしと対訳を行い、データセットを作成した.またプロンプトに効果的な文脈情報を含めるため,原言語文の意味類似度と共参照解析を活用した文脈文選択手法を提案する。自動評価指標を用いた評価の結果,英 → 日、日→英方向で異なる手法による訳質改善を確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。