2025年度 人工知能学会全国大会(第39回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[4N1-GS-7] 画像音声メディア処理:

2025年5月30日(金) 09:00 〜 10:40 N会場 (会議室1009)

座長:早川 大智(東芝)

10:20 〜 10:40

[4N1-GS-7-05] 医療現場における音声認識精度改善に向けた単語読み情報を用いた音声認識誤りの修正

〇北出 祐1、メイ ピョーカイ2、辻川 剛範1、岡部 浩司1、石井 亮3、山本 仁1、久保 雅洋1、中川 敦寛3、香取 幸夫3 (1. 日本電気株式会社、2. ヒューマンリソシア株式会社、3. 東北大学病院)

キーワード:音声認識誤り修正、単語読み、医療現場

我々は医師による記録・報告書作成の効率化を目指し、外来等の医療現場の音声を認識してその結果から医療文書を自動で作成する、医療文書作成支援システムの検討を行っている。これを実現するにあたって、入力の情報となる音声認識結果、特に医療用語が高精度に認識されていることが非常に重要である。そこで、我々は単語読み情報を用いて音声認識誤りを修正する手法を提案し、医療用語の認識率改善を試みる。具体的には、認識結果を入力としてLLM により音声認識誤りを検出する。次に、形態素解析を用いて認識誤りとして検出された単語の読みを取得する。さらに、その読みに近い単語を音素間距離に基づいてリストアップする。最後にリストアップされたLLM により単語から適切な単語を選択し認識誤りを修正する。模擬医療音声データの認識結果を用いた評価実験を行ったところ、提案手法が医療用語の誤りを12.9%削減することを確認したのでここに報告する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード