2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-16 世界モデルと知能

[2O6-OS-16a] 世界モデルと知能

2024年5月29日(水) 17:30 〜 18:50 O会場 (音楽工房ホール)

オーガナイザ:鈴木 雅大(東京大学)、岩澤 有祐(東京大学)、河野 慎(東京大学)、熊谷 亘(東京大学)、松嶋 達也(東京大学)、森 友亮(株式会社スクウェア・エニックス)、松尾 豊(東京大学)

18:10 〜 18:30

[2O6-OS-16a-03] HyperNetworksの強化学習への適用

〇澤野 千賀1 (1. 放送大学)

キーワード:強化学習、HyperNetworks、深層学習

深層強化学習は,LLM(大規模言語モデル)の学習に利用されるなど様々な応用が注目・期待されているが,課題として「学習に時間がかかる」,「複雑で実装の難易度が高い」,「良い重みパラメータの探索が困難」といった課題が明らかになってきている.そのような中で,効率的に良いネットワークを探索するようなことができ,柔軟性を向上させることができ,実装によっては知識共有やパラメータ数を減らすことができるメリットを持つ HyperNetworksに注目した.HyperNetworksは,小さなネットワークからターゲットネットワークと呼ばれる大きなメインネットワークを生成する手法である.本研究では,シンプルな強化学習環境であるGridWorldの環境で,HyperNetworksを強化学習に適用する実験と,HyperNetworksを使用しない通常のネットワークの実験との比較を行い,学習状況を比較した.実験では,学習率やbatch sizeを変更して学習を試みた.多くの実験パターンにおいてHyperNetworksは通常のネットワークよりも高い性能を示すことを検証した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード