JSAI2019

Presentation information

General Session

General Session » [GS] J-10 Vision, speech

[2M5-J-10] Vision, speech: movement of bodies and objects

Wed. Jun 5, 2019 5:20 PM - 7:00 PM Room M (Front-right room of 1F Exhibition hall)

Chair:Eiki Ishidera Reviewer:Yoko Nishihara

5:20 PM - 5:40 PM

[2M5-J-10-01] Improving object detection performance using objects’ relative positions

〇Yuichi Sasaki1 (1. Fashion Pocket, Inc.)

Keywords:Computer Vision, Deep Learning, Fashion

一般物体認識における後処理の一つとして、3つの候補領域の相対的な位置関係を学習し、改善する手法を提案する。これは特に、ファッションアイテムの認識など、常識的な組み合わせがある程度固定されている条件で、mAPの向上に寄与する。独自に収集したデータセットに対して評価を行った結果、特に靴や帽子などを中心として大きな改善が見られ、mAPで3.4%の精度向上が認められた。