2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

オーガナイズドセッション » [オーガナイズドセッション] OS-3 質感と感性

[4O2-OS-3b] 質感と感性(2)

2018年6月8日(金) 14:00 〜 15:20 O会場 (2F 開聞)

15:00 〜 15:20

[4O2-OS-3b-04] RBMを用いた楽器音基底と演奏情報への分離による多重音解析

〇荒川 賢也1、中鹿 亘1 (1. 電気通信大学)

キーワード:音楽、RBM、機械学習

近年,自動作曲など発展的な音楽研究で膨大な楽譜データが必要とされる.そのために波形信号から楽譜を自動生成も重要な問題であると考えられる.楽器音分離においてはnon-negative matrix factorization(NMF)がよく用いられているが精度には向上の余地がある.本稿では生成モデルのrestricted Boltzmann machine(RBM)を用いた楽器音分離を提案する.二つのアルゴリズムの大きな違いとしてNMFが決定的に解を求めるのに対してRBMは確率的に解を求めるという点,NMFは演奏情報行列が連続値で出力されるのに対してRBMは楽譜表現に適したバイナリ値で出力される点が挙げられる.例えば生演奏から楽譜を生成する場合,NMFよりも確率分布で議論を行うRBMの方が入力のわずかな差異に柔軟に対応できると考えられる.本研究ではそのような入力への柔軟性及び出力形式の違いからRBM及びRBMを拡張したsparse-RBMを用いて音楽の波形信号を楽器音基底行列とその演奏情報行列に分離する実験を行った.結果として提案手法はNMFと比較してわずかに良い結果を示した.