11:40 〜 12:00
[3H2-GS-9b-03] 機械学習を用いた読唇技術の手法に関する研究
キーワード:読唇、唇領域
近年,音声認識による文字化の技術が発展し,様々な場面で活用されている.しかし,騒がしい場所では認識率が低下する課題があり,この課題を解消するため,無音声でも認識できる可能性のある読唇技術によって文字化を試みたい.無音声でも文字化することが可能であれば,文字情報の必要な人にとり,騒がしい場所においてもコミュニケーションの一助となる期待があり,また,音声認識と組み合わせることによって認識率を高められる期待もある.これに関し,英語話者に対する読唇専用のソフトウェアの開発がされたが,母音の数の関係から,これを日本語に同様に適用することは難しいと考えられている.そこで本研究では,日本語話者を対象に,無音声の環境下で読唇技術を実現することが可能であるかどうか実験を行った.特定の場面においてよく用いられる文章6つに対し,10名の被験者に5回ずつ発話してもらいデータを収集した.収集したデータに対し,機械学習によって分類した結果, k-Nearest Neighbor による分類が最も精度が高かった.しかし,同時に被験者によって認識精度が異なることも明らかとなった.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。