2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-22 音楽認識・生成技術が紡ぎ出す未来の社会

[3O5-OS-22a] 音楽認識・生成技術が紡ぎ出す未来の社会

2025年5月29日(木) 15:40 〜 17:20 O会場 (会議室1010)

オーガナイザ:北原 鉄朗(日本大学文),中村 栄太(九州大学),浜中 雅俊(理化学研究所)

16:20 〜 16:40

[3O5-OS-22a-03] 複数の潜在拡散モデルを用いた名付けゲームによる楽曲の共同生成

櫻井 虹希1、〇上野山 遼音2、谷口 忠大1,2、谷口 彰1 (1. 立命館大学、2. 京都大学)

キーワード:自動作曲、潜在拡散モデル、マルチエージェント

本研究では,複数のAI エージェントによる楽曲の共同生成を行い,異なる音楽的特徴を持つ楽曲の生成を目指す.具 体的には,エージェント間で知識を共有可能なフレームワークであるメトロポリス・ヘイスティングス名付けゲームに 潜在拡散モデルを統合したMetropolis-Hastings Music generation Game (MHMG) を提案した.実験では,クラシッ クとジャズを対象とする異なるジャンルの楽曲で学習した2 つの潜在拡散モデルをエージェントとして用い,各ジャン ルの特徴を含む楽曲が生成されるかを検証した.実験結果から,fine-tuning を行わないMHMG が最も各ジャンルの特 徴を保持し,高品質な楽曲が生成することが示された.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード