2021年第82回応用物理学会秋季学術講演会

講演情報

一般セッション(口頭講演)

FS フォーカストセッション「AIエレクトロニクス」 » FS.1 フォーカストセッション「AIエレクトロニクス」

[12a-S101-1~9] FS.1 フォーカストセッション「AIエレクトロニクス」

2021年9月12日(日) 09:00 〜 11:30 S101 (口頭)

河口 研一(富士通研)

11:15 〜 11:30

[12a-S101-9] エンタングルメントと軌道角運動量によるN本腕バンディット問題の解法

〇(M1)新川 浩彬1、Nicolas Chauvet1、Bachelier Guillaume2、Huant Serge2、Roehm Andre1、堀﨑 遼一1、成瀬 誠1 (1.東大情理、2.グルノーブルアルプス大)

キーワード:エンタングルメント、強化学習、バンディット問題

競合的多本腕バンディット問題に対し、甘粕らは光の軌道角運動量とエンタングルメントを用いた確率的意思決定アルゴリズムを提案した。任意のマシン台数に対してシステムを構築可能であったが、4台以上のマシンがある時、報酬環境へのロバスト性が低くなるという問題があった。本研究では2手法を提案し、任意のマシン台数に対して、高い平均報酬を担保したまま、ロバスト性を大きく向上させられることを示した。