2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[1O4-GS-7] 画像音声メディア処理:検出・データセットの構築

2022年6月14日(火) 14:20 〜 16:00 O会場 (Room 510)

座長:石原 賢太(NEC)[遠隔]

14:20 〜 14:40

[1O4-GS-7-01] OCRのための物体検出を用いたカード帳票検出手法

〇趙 振1、橋岡 佳輝1 (1. AI inside 株式会社)

キーワード:光学文字認識、画像処理、物体検出、位置補正

スマートフォンなどで撮影された画像から運転免許証やクレジットカードなどのカード帳票に記載された情報を読み取りたいという需要がある.スマートフォンなどで撮影された画像は多くの場合,撮影者が指定した任意の位置・角度から撮影される.そのため,OCRなどの文字認識技術で読み取るためにはカード帳票の位置を検出し矩形補正する前処理と,カード帳票の回転方向を検出しカードの向きを補正する前処理が必要となる.
カード帳票を矩形補正するための位置検出や回転方向の検出は,ディープラーニングなどの手法により高精度に行うことが可能である.一方で,カード帳票の位置検出と回転方向の検出を個別のモデルで行うために検出速度の面で課題が残る.本研究では,単一の物体検出モデルを用いてカードの位置と回転方向を同時に検出することで,検出精度を維持しつつ高速にカード帳票を検出する手法を提案する.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード