19:00 〜 19:20
[3Q6-GS-8-05] 制御バリア関数と強化学習の融合による安全で高性能なシステム設計法
キーワード:強化学習、制御理論、制御バリア関数
深層強化学習は,囲碁や将棋にとどまらず,自動運転車をはじめ,実空間で人と共存しながら動作するロボット制御への導入が期待されている.近年,試行錯誤を伴う強化学習の実世界での運用に向けて,障害物や人間との衝突回避など,安全性を重視したアルゴリズムの研究が進められている.しかし,安全性の重視は,タスク処理に関する最適性などの性能を犠牲にした方法となっている.
これに対して,本研究では、深層強化学習(DRL)と,環境モデルを用いた制御バリア関数(CBF)を融合することによって,安全かつ高性能な制御則の獲得を目指す.提案法において, CBFは,物理法則に基づいた公称モデルを用いて,DRL制御器の動作の安全を保証する領域を特定する.また,測定データから得られるガウス過程モデルを用いて,公称モデルでは表現できない未知環境の不確実性の扱いを可能にしている.
これに対して,本研究では、深層強化学習(DRL)と,環境モデルを用いた制御バリア関数(CBF)を融合することによって,安全かつ高性能な制御則の獲得を目指す.提案法において, CBFは,物理法則に基づいた公称モデルを用いて,DRL制御器の動作の安全を保証する領域を特定する.また,測定データから得られるガウス過程モデルを用いて,公称モデルでは表現できない未知環境の不確実性の扱いを可能にしている.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。