2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[1E4-GS-6] 言語メディア処理

2023年6月6日(火) 15:00 〜 16:40 E会場 (大会議室 A2)

座長:長谷川 拓(NTT) [現地]

16:20 〜 16:40

[1E4-GS-6-05] 論理推論におけるVision-and-Languageモデルを用いたフレーズ間知識の補完

〇富張 聡祥1、谷中 瞳1 (1. 東京大学)

キーワード:含意関係認識、Vision-and-Language、自然言語処理、推論システム

文間の含意関係を判定する含意関係認識は、質問応答や機械翻訳などに応用される自然言語処理の重要なタスクの一つである。論理推論による手法は否定や数量などの言語現象を扱える点と含意関係の判定に至る過程の解釈性が高い点で機械学習を用いた手法より優れている。一方で、文間の含意関係の認識に必要なフレーズ間知識の補完が重要な課題である。そこで、本研究では、視覚に基づく表現が人間による含意関係の判定を容易にするという直感に基づき、視覚に基づくフレーズ表現の比較によってフレーズ間知識を補完する手法を提案する。提案手法では、まず、論理推論の過程から補完する知識の候補となる前提と結論のフレーズを得た後、Vision-and-Languageモデルを用いて、それらの視覚に基づく表現を画像またはモデル内の埋め込みベクトルの形で得る。そして、得られた表現を比較して、知識を補完するか否かを決定する。視覚に基づく表現の比較では、単純な類似度に加えて含意関係という非対称的な関係を考慮する。SICKデータセットを用いた実験の結果、提案手法を用いた論理推論システムは、提案手法を用いない場合と比べて正答率が向上した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード