2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[1O4-GS-7] 画像音声メディア処理

2023年6月6日(火) 15:00 〜 16:40 O会場 (会議室 E1+E2)

座長:渡辺 友樹(東芝) [現地]

15:40 〜 16:00

[1O4-GS-7-03] シーングラフ生成における最適輸送損失を用いた物体間関係予測

〇栗田 空知1、小山 聡1、野田 五十樹1 (1. 北海道大学)

キーワード:シーングラフ、最適輸送、コンピュータビジョン、画像認識、深層学習

シーングラフ生成における画像内の物体間の関係予測に対して, 最適輸送を用いた損失で学習することで, 従来のモデルを超える性能を一部で達成し, 学習データに少ない関係ラベルの再現率を高めた. シーングラフ生成には, データセットの関係ラベルに重度の不均衡があり, 一般的な交差エントロピーを損失とする学習ではその分布に偏った予測を行ってしまうという問題がある. そこで我々は, ラベル間の類似性を輸送コストとして明示的に反映させやすい最適輸送を損失とした学習を, シーングラフ生成における画像内の物体間の関係予測に対して行い, その効果を評価した. 最適輸送の輸送コストは, 事前学習済みモデルから得られる単語の類似度を使って定義した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード