2025年度 人工知能学会全国大会(第39回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[4N1-GS-7] 画像音声メディア処理:

2025年5月30日(金) 09:00 〜 10:40 N会場 (会議室1009)

座長:早川 大智(東芝)

09:00 〜 09:20

[4N1-GS-7-01] テレビ音声に対するアクセント位置検出

〇三上 万里菜1、松崎 拓也1 (1. 東京理科大学)

キーワード:アクセント辞書

本研究は、TV音声データを入力として単語の音声上のアクセント位置を自動検出することを目的としている。音声データから各音素のfo値、発音、単語における位置(単語の開始/終了)、品詞を特徴量として抽出し、得られた特徴量を入力とする分類器を作成した。日本語話し言葉コーパス(CSJ)の音声データで訓練を行ったモデルを使用し、テレビ音声データで予測を行った。アクセント位置の検出は、音声データを7モーラのウィンドウに分割し、中央のモーラにアクセントが来るかどうかを予測する形で行った。結果として、分類器がテレビ音声のアクセント位置を正しく予測できる精度は77〜86%程度にとどまった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード