JSAI2025

Presentation information

General Session

General Session » GS-5 Language media processing

[3G4-GS-6] Language media processing:

Thu. May 29, 2025 1:40 PM - 3:20 PM Room G (Room 1002)

座長:小原 涼馬(日本電気株式会社)

1:40 PM - 2:00 PM

[3G4-GS-6-01] Toward Extracting Language-agnostic Embeddings from Multilingual Sentence Encoders

〇Keita Fukushima1, Tomoyuki Kajiwara1, Takashi Ninomiya1 (1. Ehime University)

Keywords:Embeddings, Cross Lingual

本研究では,多言語文符号化器から言語非依存な文埋め込みを抽出し,機械翻訳の品質推定や言語横断の文類似度推定に応用する.先行研究では,多言語文符号化器から得られる文表現に対して意味表現と言語表現をそれぞれ抽出し,前者を言語非依存な文埋め込みとして使用してきた.提案手法では,このアプローチに対して,意味表現と言語表現の分離を改善するための工夫を加える.実験の結果,機械翻訳の品質推定と言語横断の文類似度推定の両方において,既存手法を上回る性能を達成した.

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Password