2020年度 人工知能学会全国大会(第34回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-3 自律・創発・汎用AIアーキテクチャ

[2M5-OS-3b] 自律・創発・汎用AIアーキテクチャ (2)

2020年6月10日(水) 15:50 〜 17:30 M会場 (jsai2020online-13)

栗原 聡(慶應義塾大学)、川村 秀憲(北海道大学)、津田 一郎(中部大学)、大倉 和博(広島大学)

15:50 〜 16:10

[2M5-OS-3b-01] 因果効果による不確実環境下における能動的行動選択の効率化

〇増井 哲史1、宮澤 和貴1、堀井 隆斗1、長井 隆行1,2 (1. 大阪大学、2. 電気通信大学)

キーワード:意思決定、因果推論、世界モデル、能動的推論、自由エネルギー原理

一般に、我々生物を含めた自律的なエージェントが対面する環境は、その特性を直接知ることはできず、不確実性を含んでいる。Fristonらが提案した自由エネルギー原理における能動的推論は、そうした不確実な環境に対して行動を起こし介入することで、予測しやすい状態に変化させ環境を知ろうとする枠組みである。しかしPearlの統計的因果推論の考え方によれば、変化の結果を観察するだけでは、自身の介入によって変化したのか、別の要因があってたまたまそう変化しただけなのか、それらの違いを正しく把握することができない。介入しなかったときこうなっただろうという反事実と比較することで、自身の行動の因果効果を定量化できる。本研究では自由エネルギー原理に基づく能動的推論を基に、世界モデルを用いた反事実の近似、および因果効果を用いた学習と意思決定の枠組みを提案する。実験では、シミュレーションを用いて不確実な環境における行動選択の振る舞いを検証した。結果から、他の要因によって突然不確実性が変化するような環境において、因果効果によってその要因の影響を考えて行動選択するような振る舞いが見られた。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード