VideoGPTのデータセットサイズに関するスケーリング則

根岸 優大

18:50 〜 19:10

[2G6-OS-21f-05] VideoGPTのデータセットサイズに関するスケーリング則

〇根岸優大^1,6、佐藤誠人^2,6、海野良介^1,6、田畑浩大^1,6、渡部泰樹^4,6、蒲原惇乃輔^5,6、久米大雅^3,6、岡田領^1,6、岩澤有祐¹、松尾豊¹ (1. 東京大学、2. 奈良先端科学技術大学院大学、3. 慶応義塾大学、4. 早稲田大学、5. 東北大学、6. 株式会社松尾研究所)

キーワード：世界モデル、スケーリング則、データセットサイズ

過去10年ほどで，深層学習技術は自然言語処理や画像処理分野を含む様々な分野で大きく成功してきた．この成功の背景には，大規模な計算資源で大規模なモデルの学習が可能になったことがある．実際近年の多くの研究において，言語モデリングや画像生成を含む様々な生成タスクで，Transformerを用いた大規模モデルが性能を発揮している．そのような大規模モデルを効率的に学習するためには膨大なデータが必要であり，多くの分野で大規模データセットの構築が進められている．しかし，CARLAなどのシミュレータ環境やRoboNetなどのデータセットの整備の進展にも拘わらず，環境の空間的・時間的表現の獲得を目的とする世界モデルのデータセットサイズに対するスケーリングについては十分に研究されていない．そこで本研究では，世界モデルのデータセットサイズに対するスケーリング則を実験的に検証した．モデルにはVideoGPTを使用し，データセットはCARLAシミュレータで作成した．さらに我々は，パラメータ数が10⁷のオーダー以上で計算量が制限される場合は，計算量をデータセットサイズの拡大に使うことが効率的であることも確認した．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[2G6-OS-21f] 世界モデルと知能

[2G6-OS-21f-05] VideoGPTのデータセットサイズに関するスケーリング則

パスワード