他者の行動による目的移行のメカニズム

西 孝介

13:20 〜 13:40

[4N2-J-7-05] 他者の行動による目的移行のメカニズム

動的選好の導入による多目的意思決定理論の拡張

〇西孝介¹、荒井幸代¹ (1. 千葉大学)

キーワード：多目的意思決定、マルチエージェント、多目的強化学習

実社会における意思決定の多くは，複数の目的を考慮する多目的意思決定である．多目的意思決定は，一般に多目的強化学習によりモデル化されており，意思決定者が一人であるシングルエージェント系を対象としている．しかし実社会では意思決定者が複数いる環境で，他者の影響を受けて目的を移行し、意思決定をすることが多い．そこで本論文では，マルチエージェント系における，多目的意思決定のモデル化を行う．他者の意思決定により選択肢の価値が変化することに着目し，動的な報酬設計を加えることで，今までのモデル化をマルチエージェント系に拡張する．また意思決定者の目的移行のメカニズムが明らかになれば，意思決定者の選択を誘導したい場面において，最適な制御則の提案に活用できる．そこで本論文では，意思決定者の目的を移行させることで，意思決定者全体の挙動を制御できることを示す．計算機実験では，他者の選択を考慮した意思決定をモデル化できたことを確認した．またモデル化で用いた目的移行のメカニズムを用いることで，意思決定者全体を理想の挙動へと制御することに成功した．

講演情報

[4N2-J-7] エージェント: 社会的マルチエージェント

[4N2-J-7-05] 他者の行動による目的移行のメカニズム

動的選好の導入による多目的意思決定理論の拡張