13:20 〜 13:40
[4N2-J-7-05] 他者の行動による目的移行のメカニズム
動的選好の導入による多目的意思決定理論の拡張
キーワード:多目的意思決定、マルチエージェント、多目的強化学習
実社会における意思決定の多くは,複数の目的を考慮する多目的意思決定である.多目的意思決定は,一般に多目的強化学習によりモデル化されており,意思決定者が一人であるシングルエージェント系を対象としている.しかし実社会では意思決定者が複数いる環境で,他者の影響を受けて目的を移行し、意思決定をすることが多い.そこで本論文では,マルチエージェント系における,多目的意思決定のモデル化を行う.他者の意思決定により選択肢の価値が変化することに着目し,動的な報酬設計を加えることで,今までのモデル化をマルチエージェント系に拡張する.また意思決定者の目的移行のメカニズムが明らかになれば,意思決定者の選択を誘導したい場面において,最適な制御則の提案に活用できる.そこで本論文では,意思決定者の目的を移行させることで,意思決定者全体の挙動を制御できることを示す.計算機実験では,他者の選択を考慮した意思決定をモデル化できたことを確認した.またモデル化で用いた目的移行のメカニズムを用いることで,意思決定者全体を理想の挙動へと制御することに成功した.