大規模言語モデルに基づく時系列概念パラメータ制御による作編曲システムの実装

川口 竜斉

16:00 〜 16:20

[3O5-OS-22a-02] 大規模言語モデルに基づく時系列概念パラメータ制御による作編曲システムの実装

〇川口竜斉¹、片寄晴弘¹ (1. 関西学院大学)

キーワード：大規模言語モデル、音楽作編曲、パラメータ制御

生成 AI の応用の一つとして，生成物の内容をパラメータで制御できるシステムの開発が進んでいる．音楽や物語などの時間的構造を持つコンテンツでは，その展開を時系列パラメータで指定できるものが提案されている．たとえば，物語生成システムの TaleBrush では主人公の幸福度を時間軸に沿って設定できたり，楽曲生成システムの SOUNDRAW では四小節ごとに楽曲の激しさを調整できたりする．しかし，これらのシステムでは操作可能なパラメータが固定されている．この問題に対して，大規模言語モデル（LLM）を活用しユーザが時系列パラメータそのものを任意に設定できる楽曲編集システムを提案する．その結果「ロボット感」「強さ」など特定の属性に応じてユーザが楽曲の展開を制御可能であることを確認した一方で，「トキメキ感」「都会感」などの多義性のあるものではユーザの理想通りに制御できなかった．本稿では，このユーザインタフェースの可能性と残る課題について議論する．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[3O5-OS-22a] 音楽認識・生成技術が紡ぎ出す未来の社会

[3O5-OS-22a-02] 大規模言語モデルに基づく時系列概念パラメータ制御による作編曲システムの実装

パスワード