2023年電子情報通信学会ソサイエティ大会

講演情報

一般セッション

基礎・境界 » 一般セッション(A)

[A-14] スマートインフォメディアシステム

2023年9月15日(金) 10:00 〜 11:30 全学教育棟 本館 中棟 1階C11講義室

座長:宮本龍介(明大)

<1〜6>
スマートインフォメディアシステム研専

[A-14-3] クラウドソーシングを利用した議事録作成における話者認識

大島千尋, 黒岩舜, 中平一六, 小板隆浩 (同志社大)

この講演は本会「学術奨励賞受賞候補者」の資格対象です。

キーワード:クラウドソーシング、話者認識、議事録、文字起こし、動画、音声

本研究では、クラウドソーシングを用いて議事録作成のための話者認識精度を向上させる方法を提案する。ワーカーが作業中に参照する情報として従来の音声に加えて動画を提供することで、話者認識の精度向上が期待できる。実験では、「音声のみ」と「音声+動画」の場合の話者認識精度を比較した。音声のみの場合では途中で誤った話者グループに声を結びつけてしまうことで話者認識の精度が低下する傾向がったが、動画を使用する場合は動画中の人物の位置や外見に基づいて話者をグループ化することができ、時刻によらず一定の一致率を示した。これにより、本実験条件における提案手法の有用性が確認できた。

講演論文集PDFを閲覧したい場合はパスワードを入力してください。

パスワードは、講演参加申込者、聴講参加申込者にメールで御連絡しております。

パスワード