2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-29 音楽認識・生成技術が紡ぎ出す未来の社会

[1O4-OS-29a] 音楽認識・生成技術が紡ぎ出す未来の社会

2024年5月28日(火) 15:00 〜 16:40 O会場 (音楽工房ホール)

オーガナイザ:北原 鉄朗(日本大学)、中村 栄太(京都大学)、浜中 雅俊(理化学研究所)

15:00 〜 15:20

[1O4-OS-29a-01] 多視点楽曲検索に向けた楽曲分離表現学習

〇橋爪 優果1、宮下 敦志1、李 莉1、戸田 智基1 (1. 名古屋大学)

キーワード:音楽情報処理、深層学習、楽曲推薦、表現学習

柔軟な推薦・検索システムを実現するためには,楽曲の複数の部分的な要素に着目した楽曲間類似度を算出し,ユーザが着目したい要素を自由に選択できるようにすることが望ましい.そのようなアプローチの一つとして,楽曲に含まれる各楽器音に個別に着目した類似度をそれぞれ計算する手法が考えられる.しかし,実際の検索システムにおいて各楽器音信号をクエリとして用いることは現実的でない.本研究では,楽曲そのものを入力とし,単一のネットワークで各楽器音に着目した類似度を計算する方法を提案する.具体的には,マスクを用いたトリプレット損失によって学習したConditional Similarity Networkによって抽出される,各楽器ごとに次元が分離された単一の類似度埋め込み空間を設計する.実験の結果,部分空間は対応する楽器の特徴を保持することができること,提案法による各楽器音に着目した類似楽曲の選択が限定的な条件下で人の知覚と対応することが示された.また本論文では,多視点楽曲検索の発展により実現されうる社会についても議論する.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード