[A-14-3] Speaker Recognition in Taking Minutes Using Crowdsourcing
この講演は本会「学術奨励賞受賞候補者」の資格対象です。
Keywords:クラウドソーシング、話者認識、議事録、文字起こし、動画、音声
本研究では、クラウドソーシングを用いて議事録作成のための話者認識精度を向上させる方法を提案する。ワーカーが作業中に参照する情報として従来の音声に加えて動画を提供することで、話者認識の精度向上が期待できる。実験では、「音声のみ」と「音声+動画」の場合の話者認識精度を比較した。音声のみの場合では途中で誤った話者グループに声を結びつけてしまうことで話者認識の精度が低下する傾向がったが、動画を使用する場合は動画中の人物の位置や外見に基づいて話者をグループ化することができ、時刻によらず一定の一致率を示した。これにより、本実験条件における提案手法の有用性が確認できた。
Abstract password authentication.
Password is required to view the abstract. Please enter a password to authenticate.