2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[4I1-GS-7] 画像音声メディア処理:

2024年5月31日(金) 09:00 〜 10:40 I会場 (41会議室)

座長:石川 開(日本電気株式会社)[[オンライン]]

09:00 〜 09:20

[4I1-GS-7-01] 精度と誤差一貫性に基づく人と深層モデルの単眼相対奥行き応答の比較

〇久保田 祐貴1、吹上 大樹1 (1. NTTコミュニケーション科学基礎研究所)

キーワード:単眼奥行き推定、誤差一貫性、奥行き知覚

奥行き推定技術は,深層学習の発展とともに精度が飛躍的に向上してきた.こうした深層モデルの性能を評価する基準の一つに,人の知覚との整合性が挙げられる.物体認識や質感に関する人と深層モデルの比較研究は存在する一方で,奥行き推定モデルに対しては行われてこなかった.本論文では,その比較を実現するため,人の自然画像に対する奥行き応答のデータセットを収集した上で,精度と誤差一貫性の観点から,単眼奥行き推定に対する人と深層モデルの応答を比較した.2点の遠近関係を回答するタスクにより比較した結果,34種類のモデルのうち27種類のモデルで人(0.708, 95%CI: [0.702, 0.713]よりも精度が高い(真値に近い)応答を示した.しかし,実験参加者間の誤差一貫性(0.447, 95%CI: [0.427, 0.465])に対して,全てのモデルで人の評価との一貫性が低かった.特に,複数のデータセットを利用することや,評価対象画像と同じ(i.i.d.の)データセットを訓練に用いないことが,人の評価との誤差一貫性を高める可能性が示唆された.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード