2023年度 人工知能学会全国大会(第37回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-21 世界モデルと知能

[2G5-OS-21e] 世界モデルと知能

2023年6月7日(水) 15:30 〜 17:10 G会場 (大会議室 A4)

オーガナイザ:鈴木 雅大、岩澤 有祐、河野 慎、熊谷 亘、松嶋 達也、森 友亮、松尾 豊

15:50 〜 16:10

[2G5-OS-21e-02] 世界モデルにおけるモデルサイズに対するスケーリング則

〇佐藤 誠人1,6、海野 良介2,6、根岸 優大2,6、田畑 浩大2,6、渡部 泰樹3,6、蒲原 惇乃輔4,6、久米 大雅5,6、岡田 領2,6、岩澤 有祐2、松尾 豊2 (1. 奈良先端科学技術大学院大学、2. 東京大学、3. 早稲田大学、4. 東北大学、5. 慶応義塾大学、6. 株式会社松尾研究所)

キーワード:世界モデル、大規模言語モデル、スケーリング則

深層学習の発展に伴い、コンピュータビジョンや自然言語処理の分野において、大幅な性能向上が見られる。これらの発展において、モデルサイズ、データセットサイズ、学習に使用する計算量に対して、モデルの性能が指数関数的に変化することを示すスケーリング則が大きな役割を果たしている。これらのスケーリング則は、画像分類、画像生成、自然言語処理タスクなど、様々なタスクで成立することが報告されている。しかし、スケーリング則が長期的な予測を伴うタスクに有効であることはまだ確認されていない。本研究では、モデルサイズの観点から世界モデルにスケーリング則が成立することを調査した。CARLAデータセットを用いた行動条件づけ動画予測タスクにおいて2つの世界モデルのモデルサイズを大規模化する実験を行い、オートエンコーダの大規模化を含む場合に損失関数が指数関数的に減少し、スケーリング則が成り立つことを検証した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード