2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-2 機械学習

[3K3-J-2] 機械学習: 基礎モデルの分析と検証

2019年6月6日(木) 13:50 〜 15:30 K会場 (201A 中会議室)

座長:鈴木 雅大(東京大学) 評者:小山 聡(北海道大学)

13:50 〜 14:10

[3K3-J-2-01] Batch Normalizationつき3層ニューラルネットワークの学習ダイナミクスの統計力学的定式化

〇高木 志郎1、吉田 雄紀1、岡田 真人1 (1. 東京大学大学院新領域創成科学研究科)

キーワード:ニューラルネットワーク、バッチ正規化、統計力学

Batch Normalizationはニューラルネットワークの学習を高速化,安定化させ,汎化性能を向上させる方法として知られている.しかし,その知名度に比してBatch Normalizationがニューラルネットワークの学習ダイナミクスに与える影響についての理解は依然として不十分である.近年この問題に取り組むいくつかの研究が出てきているが,Batch Normalizationつきニューラルネットワークの学習ダイナミクスを解析的に導出した研究はほとんどない.学習ダイナミクスを導出することはBatch Normalizationが学習にどのような影響を与えているかについて理解する上で重要であるため,我々は統計力学的な手法を用いた先行研究を頼りに,Batch Normalizationつき3層ニューラルネットワークの学習ダイナミクスを解析的に導出した.具体的には,Batch Normalizationありのニューラルネットワークについて,系の大域的な挙動を表すオーダーパラメータの微分方程式を導出した.