2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[1O3-GS-7] 画像音声メディア処理

2023年6月6日(火) 13:00 〜 14:40 O会場 (会議室 E1+E2)

座長:田崎 豪(名城大学) [オンライン]

14:20 〜 14:40

[1O3-GS-7-05] 発話音声の音響特徴量を用いた抑うつ度推定手法

〇森 浩貴1、目良 和也1、黒澤 義明1、竹澤 寿幸1 (1. 広島市立大学)

キーワード:音声分析、ベックうつ病調査表、機械学習

本論文では,入力発話から得られた音響特徴量を用いて話者の抑うつ度を推定する手法を提案する.学習用発話音声データは実験参加者に同じ10文を音読してもらうことで収録し,音声収録の直後にベックうつ病調査票(BDI)に回答してもらうことで抑うつ度を判定している.音響特徴量については,2種類の音響分析器(openSMILE,Surfboard)で算出した音響特徴量セットおよびそこから絞り込んだ音響特徴量セットを用いる.また,機械学習器にはサポートベクター回帰とLightGBMの2種類を用いる. 実験の結果,leave-one-outで最も正解値との相関が高かったのは学習器LightGBM,特徴量Surfboardを用いた手法であった(相関係数0.932).一方,leave-one-person-outでは,学習器LightGBM,特徴量Surfboard(絞り込み)を用いた手法で最も相関が高かった(相関係数0.344) が,全体的に相関が弱い傾向にあった.そこで,抑うつ度が極端に高いデータおよび極端に低いデータを除いて再度実験を行ったところ,相関係数0.798という結果が得られた.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード