2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[1D3-GS-7] 画像音声メディア処理:

2024年5月28日(火) 13:00 〜 14:40 D会場 (イベントホール仮設2)

座長:田崎豪(名城大学)

14:00 〜 14:20

[1D3-GS-7-04] 音声認識結果と誤読候補リストを用いた読み間違い検出

〇齊藤 新1、松崎 拓也1 (1. 東京理科大学)

キーワード:人工知能、音声認識

本研究では初等教育における音読指導をサポートすることを目的として,音声データに含まれる読み誤りを音声認識結果と誤読候補リストを用いて検出する手法を開発した.まず,音素列の形式で音声認識を行い,形態素単位で正解テキストと比較し読み間違いを検出する.その際,音声認識の誤りと実際の誤読を区別するために,読み得る誤読の候補を作成し,正解の読み及び誤読候補の中で音声認識結果との編集距離が最も小さくなるものを選択する.選択した読みが正解と異なる場合,読み誤りとして検出した.本手法を LaboroTVspeech 及び日本語話し言葉コーパスに対し適用した.また,合成音声により読み誤りを含む音声を生成し,読み誤り検出を行った.その結果,正しく読み上げていた場合でも読み誤りとして検出されるケースが多く見られたものの,誤読として想定している通りに読み上げていた場合 80.0% の音声に対し正しく読み誤りを検出することに成功し,本論文の有効性を実証した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード