13:00 〜 13:20
[4G2-GS-7-04] エージェント強化学習によるダイナミックプライシングを用いたシェアサイクル運用システムの研究
キーワード:シェアサイクル、強化学習、エージェントシミュレーション
本研究では、利用者にインセンティブを提示することで特定のステーションへの返却行動を促し、従来のトラックによる配車を主体とする運営とは、抜本的に異なる事業運営モデルの検証を目的とする。検証には、全体を俯瞰して指示を出すエージェントに強化学習を利用し、強化学習に用いる価値Q(s,a)の算出には、階層型ニューラルネットワークによる関数近似の手法を用いた。実験の結果、全体を俯瞰するエージェントが需要の緩急を見極め適切な指示を行い、ステーションの残台数が0台にならない運用が確認された。また、従来のトラックによる運用と比較しても、コストを約20%低減する可能性が結果から示されており、強化学習による自律的なシステム運用の有用性が示唆された。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。