2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-22 音楽認識・生成技術が紡ぎ出す未来の社会

[3O5-OS-22a] 音楽認識・生成技術が紡ぎ出す未来の社会

2025年5月29日(木) 15:40 〜 17:20 O会場 (会議室1010)

オーガナイザ:北原 鉄朗(日本大学文),中村 栄太(九州大学),浜中 雅俊(理化学研究所)

15:40 〜 16:00

[3O5-OS-22a-01] 深層生成モデルと作品選択モデルに基づく歌詞付きメロディの評価値予測

〇西村 草介1、中村 栄太1 (1. 九州大学)

キーワード:音楽情報処理、自動作曲、深層生成モデル、音楽の自動評価

機械学習を用いた自動作曲の研究が盛んに行われる中、楽曲の品質を自動で評価する手法の重要性が高まっている。本研究では、歌唱メロディの評価値を予測する手法について考え、楽曲の歌いやすさや聴きやすさに関連する歌詞とメロディの関係性に着目する。人間による評価値データを必要としない手法の構築を目指し、「作曲家は多数生成する作品候補の中から、歌詞に対する適合度を重みとして選択したメロディを作品として残す」という仮定に基づいた作品選択モデルを提案する。このモデルでは、楽曲の適合度は歌詞の条件付きと条件なしのメロディ生成確率の比により表される。これらの確率を推定するため、深層生成モデルであるLSTMネットワークをポピュラー音楽の歌詞付きメロディデータを用いて学習する。歌詞の条件付きメロディ生成モデルの入力には、従来注目されてきた歌詞のアクセント情報に加え、単語境界など様々な歌詞特徴量を取り入れる。聴取実験から得られた評価値データを用いた性能評価実験の結果、実測値と提案手法による予測値との間に有意な相関が確認され、生成モデルとしてマルコフモデルを用いた場合よりも予測誤差が低下することが示された。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード