16:00 〜 16:20
[3O5-OS-22a-02] 大規模言語モデルに基づく時系列概念パラメータ制御による作編曲システムの実装
キーワード:大規模言語モデル、音楽作編曲、パラメータ制御
生成 AI の応用の一つとして,生成物の内容をパラメータで制御できるシステムの開発が進んでいる.音楽や物語などの時間的構造を持つコンテンツでは,その展開を時系列パラメータで指定できるものが提案されている.たとえば,物語生成システムの TaleBrush では主人公の幸福度を時間軸に沿って設定できたり,楽曲生成システムの SOUNDRAW では四小節ごとに楽曲の激しさを調整できたりする.しかし,これらのシステムでは操作可能なパラメータが固定されている.この問題に対して,大規模言語モデル(LLM)を活用しユーザが時系列パラメータそのものを任意に設定できる楽曲編集システムを提案する.その結果「ロボット感」「強さ」など特定の属性に応じてユーザが楽曲の展開を制御可能であることを確認した一方で,「トキメキ感」「都会感」などの多義性のあるものではユーザの理想通りに制御できなかった.本稿では,このユーザインタフェースの可能性と残る課題について議論する.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。