IEICE Society Conference 2023

Presentation information

一般セッション

基礎・境界 » 一般セッション(A)

[A-10] システム数理と応用

Wed. Sep 13, 2023 9:00 AM - 11:30 AM 全学教育棟 本館 中棟 1階C10講義室

座長:白井匡人(島根大),尾崎敦夫(阪工大)

<1〜9>
システム数理と応用研専

[A-10-8] Safe deep reinforcement learning with arbitration mechanism and supervisor among agents

山﨑達志1, 潮俊光2 (1.摂南大, 2.南山大)

Keywords:強化学習、スーパバイザ制御、安全

深層強化学習は複雑なタスクの方策も学習できる手法として活用が進んでいる。しかし,試行錯誤による探索を伴うため,学習途中などで望ましくない行動をとる可能性がある。また,深層ニューラルネットワーク内部の判断を説明することは困難であり,動作の安全性を理論的に保証することは難しい。これに対し,安全な強化学習を指向した研究が行われている。本研究では,複数のエージェントが存在し,それぞれに学習を進める環境下にスーパバイザと調停器を導入する。安全のために許容される行動の集合をスーパバイザが提示し,調停器によりその中から最適な行動を選択する新たな深層強化学習の枠組みを提案する。

Abstract password authentication.
Password is required to view the abstract. Please enter a password to authenticate.

Password