第16回データ工学と情報マネジメントに関するフォーラム

講演情報

一般発表

Track 4: メディア処理・HCI・人間中心情報マネジメント

音楽

2024年2月28日(水) 13:30 〜 15:40 T4-A (オンライン(Zoom Events))

座長:佃 洸摂(産業技術総合研究所) 
コメンテータ:富井 尚志(横浜国立大学)

14:20 〜 14:45

[T4-A-2-04] 人体キーポイントを用いて映像に整合する楽器音を生成するモデルの提案

*岡野 日翔1、清 雄一1、田原 康之1、大須賀 昭彦1 (1. 電気通信大学)

発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり(デモ)

キーワード:音生成AI、深層学習モデル、楽器演奏、音声・画像処理、人体キーポイント