13:50 〜 14:10
[152] 敵対的逆強化学習を用いた歩車相互作用モデルの推定
キーワード:プローブパーソンデータ、歩行者、経路選択、敵対的逆強化学習
近年、都市部におけるウォーカビリティの重要性が見直され、様々な歩行者行動モデルが提案されている。しかし、その多くは、マルチモーダルな状況を扱っていない。通常、道路上の歩行者と車両は互いに認識しあっており、一方の行動が他方に影響を与える。この影響を再帰的ロジットモデルで定式化すると、推定に非常に高価な反復計算が必要となる。
そこで、本研究では、敵対的逆強化学習に基づく新たな手法を提案した。このモデルでは、1回の学習で各モードのリンク価値関数を学習するため、計算コストが大幅に削減される。松山の事例では、RLと同レベルの推定をより少ない時間で行うことができた。
そこで、本研究では、敵対的逆強化学習に基づく新たな手法を提案した。このモデルでは、1回の学習で各モードのリンク価値関数を学習するため、計算コストが大幅に削減される。松山の事例では、RLと同レベルの推定をより少ない時間で行うことができた。