JSAI2025

Presentation information

Poster Session

Poster session » Poster Session

[1Win4] Poster session 1

Tue. May 27, 2025 3:30 PM - 5:30 PM Room W (Event hall D-E)

[1Win4-07] Reward Estimation Model Reflecting Causal Graphs

〇Mariko Sugimura1, Ichiro Kobayashi1 (1.Ochanomizu University)

Keywords:Causal Model, Off-Policy Evaluation

本研究はオフポリシー評価の精度向上を目的とし、因果探索で生成した因果グラフを用いた新たな報酬推定モデルを提案する。オフポリシー評価とは、ある意思決定ポリシーを実運用せずに別のポリシーの運用データから仮想的に評価する手法である。しかし、一般的にオフポリシー評価で報酬推定モデルとして用いられる従来の機械学習モデルは、データの選択バイアスに十分な対応が難しい。そこで本研究では、因果探索で得た因果グラフを基に因果モデルを構築して報酬推定モデルとして使用することで、選択バイアスの解消による推定精度の向上を図る。因果モデルは因果関係を明確にすることで単なる相関に基づく予測を超え、より適切な意思決定を推測できることが期待される。本研究では、ZOZOTOWNが提供するデータセットを用いて因果モデルを構築し、報酬推定モデルとして利用可能であるかを検証した。

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Password