2021年度 人工知能学会全国大会(第35回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[4I2-GS-7c] 画像音声メディア処理:音声認識と指示理解

2021年6月11日(金) 11:00 〜 12:40 I会場 (GS会場 4)

座長:宮西 大樹(国際電気通信基礎技術研究所)

11:40 〜 12:00

[4I2-GS-7c-03] キーワードスポッティング向けNeural ODEを用いたパラメータ削減手法の提案

〇更田 裕司1、森田 行則1 (1. 産業技術総合研究所)

キーワード:キーワードスポッティング、ニューラルネットワーク、深層学習

近年高精度のキーワード音声認識(キーワードスポッティング)を実現する為に、ニューラルネットワークを用いる手法が多数提案されている。キーワードスポッティングはスマートスピーカーなどエッジデバイスで実行される事が通常で、ネットワークのパラメータ数や計算量の削減が求められる。そこで本稿では、ニューラルネットワークのパラメータ数を削減する手法として、常微分方程式に基づくニューラルネットワークであるNeural ODEを適用することを提案する。本技術を用いることで、キーワードスポッティングの精度を維持しつつパラメータ数を68%削減できることを示す。一方で、Neural ODEは、実行の際に常微分方程式を解く必要がある為、計算量が多いという課題がある。そこで、推論時の計算量を削減する手法も併せて提案する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード