2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[1O4-GS-7] 画像音声メディア処理:検出・データセットの構築

2022年6月14日(火) 14:20 〜 16:00 O会場 (Room 510)

座長:石原 賢太(NEC)[遠隔]

14:40 〜 15:00

[1O4-GS-7-02] 物体検出タスクに対する教師なしセグメンテーションモデルを用いた画像データ拡張手法

〇市川 裕人1、島田 健一郎1、丹野 良介1、泉谷 知範1 (1. NTTコミュニケーションズ株式会社)

キーワード:データ拡張、画像検知、セグメンテーション

物体検出モデルを学習する際はラベルやBounding Box(BB)を人力で設定する必要があるが、これらのラベリングコストの重さが大きな課題となっている。この問題を解決するデータ拡張技術の手法の一つとしてオブジェクトを背景画像にランダムに貼り付ける方法がある。しかしBBでオブジェクトを四角に切り出すことにより貼り付け先画像との境界部分が不自然になり、学習させたモデルの精度が低下する可能性があった。これに対しセグメンテーションモデルを利用し、BBからオブジェクトのみを切り抜いて貼り付けることで、実データに近い画像を生成する方法がある。本論文では教師無しセグメンテーションモデルであるCopy-Paste GAN(CP-GAN)を組み合わせて適用することで、本来生じる教師マスクを作成するコストをかけずに貼り付け先との境界部分が自然な画像を生成する手法を提案する。これによって手軽に画像データを水増しし、検出精度を上げることが期待される。 実験ではフリーのデータセットを用いて本手法、既存手法それぞれで生成した画像データセットで物体検出タスクを行い比較することで、提案手法の効果を確認した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード