2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-29 音楽認識・生成技術が紡ぎ出す未来の社会

[1O4-OS-29a] 音楽認識・生成技術が紡ぎ出す未来の社会

2024年5月28日(火) 15:00 〜 16:40 O会場 (音楽工房ホール)

オーガナイザ:北原 鉄朗(日本大学)、中村 栄太(京都大学)、浜中 雅俊(理化学研究所)

15:40 〜 16:00

[1O4-OS-29a-03] 拡散モデルを用いた感情に基づいた音楽生成への取り組み

〇川邉 もゆ1、小林 一郎1 (1. お茶の水女子大学)

キーワード:拡散モデル、音楽生成、感情

拡散過程を用いたモデル技術は、生成の分野において生成品質・拡張性が高い点、学習が安定に行える点などで近年注目されており、拡散モデルを用いて要望に応じた音楽生成の研究も行われている。しかし拡散モデルにおいて、複雑な属性に対して制御を行うのは難しい。また音楽と密接な関わりのある感情に重点を置いた音楽生成の手法もまだ多くはない。
本研究では音楽生成に関する研究への取り組みとして、感情を入力として感情に対応する音楽属性によって制御を行いながら、拡散モデルを用いて多様な音楽を生成できる手法の開発を目指す。拡散モデルには、各時間デノイズの段階で分類器を用いることで制御性を図ることが可能なDiffusion-LMという手法を使用し、分類器では音楽属性値を使用することで感情の識別を行い、入力した感情情報に基づいた音楽生成を行なった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード