2019年度 人工知能学会全国大会(第33回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » [OS] OS-4 自律・創発・汎用AIアーキテクチャ

[3D4-OS-4b] 自律・創発・汎用AIアーキテクチャ(2)

2019年6月6日(木) 15:50 〜 17:10 D会場 (301B 中会議室)

栗原 聡(慶應義塾大学)、川村 秀憲(北海道大学)、津田 一郎(中部大学)、大倉 和博(広島大学)

15:50 〜 16:10

[3D4-OS-4b-01] 階層型強化学習 RGoal アーキテクチャへの再帰呼び出し用スタックの導入

〇一杉 裕志1、高橋 直人1、中田 秀基1、佐野 崇2 (1. 産業技術総合研究所、2. 成蹊大学 理工学部 情報科学科)

キーワード:階層型強化学習、モデルベース強化学習、ゼロショット学習

人間は何か目的を達成するために適切なサブゴールを設定できる。
さらに必要に応じてそのサブゴールを再帰的に設定することができ、その再帰の深さには制約がないように見える。
我々はこれまでに、この振る舞いにヒントを得た階層型強化学習の新しいアーキテクチャとして、RGoal アーキテクチャを提案した。
本稿では、サブルーチンの再利用性を高めるために、
アーキテクチャに呼び出し用スタックを導入する方法を提案する。
そして、マルチタスク環境での迷路タスクにより性能を評価した。
その結果、スタックの深さの最大値が大きいほど、収束が早くなる傾向がみられた。
今後このアーキテクチャを拡張し、脳の前頭前野周辺の情報処理機構のモデルを構築することを目指す。