2021年度 人工知能学会全国大会(第35回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[4I1-GS-7b] 画像音声メディア処理:マルチモーダル処理

2021年6月11日(金) 09:00 〜 10:40 I会場 (GS会場 4)

座長:石原 賢太(NEC)

10:20 〜 10:40

[4I1-GS-7b-05] 画像を通じた同義文の潜在空間における対応関係の学習

〇孫 延君1、小林 一郎1 (1. お茶の水女子大学)

キーワード:マルチモーダル処理

本研究では,潜在空間における各モダリティの変数間の関係を明らかにすることで,マルチモーダル情報が単一モーダル情報の理解を向上させることができるかどうかを検討することを目的としている.ここでは,特に画像と自然言語という2つのモダリティに着目し,同義文への共通画像が潜在空間を介したそれら2つの文間の変換に有用かどうかを検討した.実験の結果,文の内容を反映した画像を用いて入力文を再構成する場合,画像を用いない場合に比べて精度と効率が高いことを確認した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード