[3Xin2-39] 特殊詐欺に対する音声認識を用いた話者の推定
キーワード:特殊詐欺、音声認識
特殊詐欺は主に高齢者をターゲットとし,その被害は増加傾向にある.警視庁によると「第三者への相談」が推奨されているが,心理的動揺により自身での対処は難しいことが想定される.そこで,本研究では被害者が誰と話していたのかという情報を第三者に伝えるため,警察が公開する特殊詐欺の音声ファイル66件を分析し,話者の職業や続柄を正確に推定できるか検証した.方法は,Wisperの2つのモデルを用いて音声ファイルから文字を起こし,形態素解析から得られた単語群を作成し,ChatGPTを活用した話者の推定を行った.その結果,Largeモデルでは,話者の推定精度が75.8%だった.一方,Tinyモデルの話者の推定精度は30.3%と比較的低かった.この精度の差は,文字起こしの精度が話者の推定精度に影響しているがわかったので音質の最適化が今後の課題である.結論,特殊詐欺対策における可能性を示したため,今後の研究への基盤を提供する.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。