2024年度 人工知能学会全国大会(第38回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[4Xin2] ポスターセッション2

2024年5月31日(金) 12:00 〜 13:40 X会場 (イベントホール1)

[4Xin2-93] 会議翻訳における文脈情報を考慮した少数ショット学習

〇上田 将矢1、竹谷 謙吾1、岡本 憲卓1、菊入 圭1 (1.株式会社NTTドコモ)

キーワード:機械翻訳、少数ショット学習、文脈翻訳

ビジネス会議では,異言語話者間で情報交換が行われることがある.このような状況での円滑なコミュニケーションを促進するため,話し言葉を対象とした機械翻訳(MachineTranslation, MT)のニーズが高まっている。話し言葉は指示代名詞や省略表現が多い,固有名詞や固有表現が多いといった傾向があるため, 話の流れ(文脈情報) を考慮して翻訳(文脈翻訳)を行う必要がある.本研究では,ビジネス会議を想定し,日 ↔ 英の翻訳を対象に,大規模言語モデル (Large Language Model, LLM)を用いた文脈翻訳についての研究を行う.実際の会議に即した評価を行うため,我々は実際の会議音声データの書き起こしと対訳を行い、データセットを作成した.またプロンプトに効果的な文脈情報を含めるため,原言語文の意味類似度と共参照解析を活用した文脈文選択手法を提案する。自動評価指標を用いた評価の結果,英 → 日、日→英方向で異なる手法による訳質改善を確認した.

要旨・抄録、PDFの閲覧には参加者用アカウントでのログインが必要です。参加者ログイン後に閲覧・ダウンロードできます。
» 参加者用ログイン