2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-22 音楽認識・生成技術が紡ぎ出す未来の社会

[3O5-OS-22a] 音楽認識・生成技術が紡ぎ出す未来の社会

2025年5月29日(木) 15:40 〜 17:20 O会場 (会議室1010)

オーガナイザ:北原 鉄朗(日本大学文),中村 栄太(九州大学),浜中 雅俊(理化学研究所)

16:00 〜 16:20

[3O5-OS-22a-02] 大規模言語モデルに基づく時系列概念パラメータ制御による作編曲システムの実装

〇川口 竜斉1、片寄 晴弘1 (1. 関西学院大学)

キーワード:大規模言語モデル、音楽作編曲、パラメータ制御

生成 AI の応用の一つとして,生成物の内容をパラメータで制御できるシステムの開発が進んでいる.音楽や物語などの時間的構造を持つコンテンツでは,その展開を時系列パラメータで指定できるものが提案されている.たとえば,物語生成システムの TaleBrush では主人公の幸福度を時間軸に沿って設定できたり,楽曲生成システムの SOUNDRAW では四小節ごとに楽曲の激しさを調整できたりする.しかし,これらのシステムでは操作可能なパラメータが固定されている.この問題に対して,大規模言語モデル(LLM)を活用しユーザが時系列パラメータそのものを任意に設定できる楽曲編集システムを提案する.その結果「ロボット感」「強さ」など特定の属性に応じてユーザが楽曲の展開を制御可能であることを確認した一方で,「トキメキ感」「都会感」などの多義性のあるものではユーザの理想通りに制御できなかった.本稿では,このユーザインタフェースの可能性と残る課題について議論する.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード