18:10 〜 18:30
[2O6-OS-16a-03] HyperNetworksの強化学習への適用
キーワード:強化学習、HyperNetworks、深層学習
深層強化学習は,LLM(大規模言語モデル)の学習に利用されるなど様々な応用が注目・期待されているが,課題として「学習に時間がかかる」,「複雑で実装の難易度が高い」,「良い重みパラメータの探索が困難」といった課題が明らかになってきている.そのような中で,効率的に良いネットワークを探索するようなことができ,柔軟性を向上させることができ,実装によっては知識共有やパラメータ数を減らすことができるメリットを持つ HyperNetworksに注目した.HyperNetworksは,小さなネットワークからターゲットネットワークと呼ばれる大きなメインネットワークを生成する手法である.本研究では,シンプルな強化学習環境であるGridWorldの環境で,HyperNetworksを強化学習に適用する実験と,HyperNetworksを使用しない通常のネットワークの実験との比較を行い,学習状況を比較した.実験では,学習率やbatch sizeを変更して学習を試みた.多くの実験パターンにおいてHyperNetworksは通常のネットワークよりも高い性能を示すことを検証した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。