2021年度 人工知能学会全国大会(第35回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[4I1-GS-7b] 画像音声メディア処理:マルチモーダル処理

2021年6月11日(金) 09:00 〜 10:40 I会場 (GS会場 4)

座長:石原 賢太(NEC)

09:20 〜 09:40

[4I1-GS-7b-02] Multi-modal Few-shot One-class Image Classification の為のメタラーニング手法の提案

〇大熊 拓海1、中山 英樹1 (1. 東京大学)

キーワード:メタ学習、Few-shot 学習、Zero-shot 学習、Multi-modal 学習、コンピュータビジョン

One-class Image Classification (OCIC) は入力画像が特定のクラスに属するか否かを識別する機械学習タスクであり,本タスクは視覚的な概念認識の為に重要である.
人間は少数データのみを用いて概念認識を高い精度で行うことができ,先行研究で提案されているFew-shot Learning手法の性能は人間と比較すると大きく劣っている.
この性能を高めるために,我々は「Multi-modal Belongingness Network (MMBeNet)」を提案する.
MMBeNetは「Belongingness Network」と呼ばれるFew-shot OCIC手法を、少数の画像データに加えて「属性」や「Word Vector」といった意味情報を用いる目的で拡張した手法である.
このように少数画像と意味情報からOCICを解くタスクを我々は「Multi-modal Few-shot One-class Image Classification」と呼ぶ.
我々は意味情報を視覚的概念認識能力に対する重要な要素とみなし,実際に意味情報を用いることで精度を高めることが可能であることを実験によって確かめた.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード