18:30 〜 18:50
[2K6-GS-2-04] 階層型強化学習を用いた交通流変化に追従する分散型交通信号制御
キーワード:強化学習、階層型制御、交通信号制御、自律分散制御
交通信号制御の効率化にあたっては,広範囲の交通流最適化を考える必要がある一方で,制御範囲の大きさに伴う計算負荷も考慮する必要がある.そこで交差点ごとに周辺交通流を最適化するエージェントを想定し協調させる自律分散制御が望ましい.深層強化学習を用いた制御は,複雑な事前設定が必要なルールベースに代わる新たな手法として近年盛んに研究されており,様々な環境下で既存手法を上回る性能を示している.強化学習では,学習時に経験した環境に対して最適な方策 (制御則) を学習するが,学習時に未経験の環境に対する性能は保証されない.なおかつ,交通信号制御問題において,交差点には直交する交通流の間にトレードオフの関係が存在するため,最適方策が一つとは限らない.これら二つの問題点を解決し,大規模交通網における交差点の連携制御の実現するため,本研究では (1) 交差点における交通流量比率ごとの網羅的な方策の獲得 (2) 周辺の交通状況を考慮した方策の選択,の二種類のエージェントからなる階層構造を持つ交通信号制御手法を提案する.計算機実験により,提案手法が交通流変化に追従して方策を切替えられる柔軟性を持つことを示す.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。