11:00 〜 11:20
[4H2-GS-11c-01] 重要状態抽出による自律エージェントの説明性:連続状態空間への拡張
キーワード:説明可能性、自律エージェント、強化学習
人間の生活のパートナーとなる自律エージェントの実現には,意思決定精度を高めるだけでなく,意思決定に対しユーザーからの信頼を得ることが重要である.そこで我々は,MDPの枠組みを仮定した自律エージェントを対象とし,重要場面の提示により現在状態から目標状態までの遷移をユーザーに簡潔に説明するための枠組みを提案した.しかし,離散的な状態空間を仮定しており,連続的な状態空間に直接適応することができないという問題があった.そこで本研究は,説明手法を連続状態空間に拡張することを目的とする.提案手法は,はじめに連続状態空間をクラスタリングし,目標状態到達のために特に通過すべきクラスタを同定する.そしてそのクラスタ内で,目標状態までの遷移に際し実際に通過する状態を重要場面として提示する.提案手法の説明生成能力を検証するために,報酬獲得に複数状態の経由が必須であるシミュレーション環境を用いて実験を行った.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。