17:50 〜 18:10
[2K6-GS-2-02] 英語音声データの機械学習による感情分類と日本語モデルとの比較検証
キーワード:音声認識、感情分類、機械学習
近年、コロナ禍による生活習慣の変化などにより、うつ病や精神的な負担を抱える方が増加傾向にある。そのような背景から、本研究では現代人の精神面の課題解決の取り組みの一つである、人工知能が音声から感情を分析し、ネガティブな感情を感知したら元気づける言葉をかけるといった、人の心を支援するシステムの要素技術を研究する。本研究では高精度な音声の感情分類モデルの構築のため、音声認識の課題であるデータの取り扱いや分析手法の選定に着目する。筆者らはこれまでに、決定木やニューラルネットワークを適用した感情分類モデルを作成し、言葉と感情との関係性に焦点を置いた研究を行ってきた。本稿では、モデル構築時のデータ特性にも着目し、IEMOCAPデータベースの英語音声データを用いる。これまで日本語の音声データを用いて構築したモデルや特徴量の傾向を基にして、英語音声での感情分類を行う。音声データの特徴量であるフォルマントについて、日本語データで分析した際に得られた傾向を英語データでも検証する。言語の違いによるモデルの精度や傾向を比較し、さらなる感情分類モデルの精度向上を目指す。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。