2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[2C6-GS-7] 画像音声メディア処理:

2024年5月29日(水) 17:30 〜 19:10 C会場 (イベントホール仮設1)

座長:寺下直行(株式会社日立製作所)

17:50 〜 18:10

[2C6-GS-7-02] 広告動画視線予測のためのバックボーン変更による
顕著性マップ予測モデルの性能改善

渡邉 太郎1、〇大西 一貫1 (1. 株式会社博報堂テクノロジーズ)

キーワード:顕著性マップ、行動認識モデル、広告動画

広告の制作段階において、広告映像のどの部分が主に視聴者の注目を集めているかをフィードバックすることは、より効率的な広告映像の制作につながる重要なポイントである。そこで、エンコーダ部のバックボーンを、より性能の良いアクション認識モデルに置き換え、UNetライクなエンコーダ・デコーダ構造にすることで、性能向上を図る。6種類のアクション認識モデル(S3D、Slow、X3D、Slowfast、MoViNet、Uniformer)を選択し、3種類のベンチマークを用いて推定精度を評価した。行動認識モデルの識別精度と顕著性予測精度の間に相関は見られなかった。小領域や低コントラスト領域では改善が見られたが、物体の動き予測が必要な場合はあまり改善されなかった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード