[4Xin1-46] Webページからの人物画像抽出への文書分類モデルの導入と顔類似度によるDistant Supervision
キーワード:情報抽出、Distant Supervision、文書分類、顔画像認識
検索サービスにおいて,人物の画像や概要文といった情報を表示する直接回答が広くユーザに認知されている.人物画像の紐付けは,Webコンテンツに含まれる画像キャプションと人名とのマッチングにより行われる.しかし,人名が画像のキャプションに部分一致する場合,キャプションが意味的曖昧性を含む可能性があり,画像に写る人物が対象の人物であるかどうかを判定する点で課題がある.本研究では,人名が部分一致する画像キャプションが対象の人物を表すかどうかを判定するために,大規模汎用言語モデルをベースとした分類モデルを作成し,曖昧性解消と精度改善を目指す.また,人物の顔画像を比較することによるデータセット作成手法を提案する.提案するデータセット作成手法では人物の顔領域をベクトル化し,正解画像と候補画像との類似度を基準としてアノテーションを自動化する.作成したデータセットを用いて,画像キャプションが対象の人物を表す文字列かどうかを判定する分類モデルを学習し,既存のルールベースフィルタとの比較評価を行った.評価の結果,マッチングの精度が改善することを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。