日本語音声認識誤り訂正のための擬似誤りデータ作成と評価

杉山 雅和; 吉村 綾馬; 友松 祐太; 小町 守

[2Yin5-04] 日本語音声認識誤り訂正のための擬似誤りデータ作成と評価

〇杉山雅和¹、吉村綾馬²、友松祐太¹、小町守² (1.株式会社AI Shift、2.東京都立大学)

キーワード：文法誤り訂正、音声認識、擬似誤りデータ

近年、音声認識や音声合成の性能が向上しておりそれらを用いた音声自動応答サービスが広く提供され始めている。音声自動応答サービスでは音声認識の精度がサービスの質に直結する重要な要素であるが、性能が向上しているとはいえ音声認識の精度は完璧ではない。そこで我々は音声認識誤りを含む音声認識結果を、文法誤り訂正と同じように訂正することを考える。文法誤り訂正は、巨大なコーパスで事前学習した言語モデルを用いた深層学習系の手法の台頭により性能が飛躍的に向上しているが、音声認識誤りを含む大規模な日本語コーパスは存在しない。そこで小規模な音声認識コーパスから誤り傾向を分析して誤り付与ルールを策定し、そのルールを巨大な日本語コーパスに適用することで、自動的に擬似音声認識誤りコーパスを作成した。本研究では複数の条件で作成した擬似誤りコーパスを事前学習に用いてTransformerによる誤り訂正の実験を行い、コーパス作成の設定が精度に与える影響の評価を行う。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[2Yin5] インタラクティブ2

[2Yin5-04] 日本語音声認識誤り訂正のための擬似誤りデータ作成と評価

パスワード