2023年度 人工知能学会全国大会(第37回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-6 言語とコミュニケーションの創発 ~記号創発システムから共創的言語進化まで~

[4H2-OS-6a] 言語とコミュニケーションの創発 ~記号創発システムから共創的言語進化まで~

2023年6月9日(金) 12:00 〜 13:40 H会場 (中会議室 B1)

オーガナイザ:上田 亮、谷口 忠大、鈴木 麗璽、中村 友昭、橋本 敬

12:00 〜 12:20

[4H2-OS-6a-01] シグナリングゲームにおけるエントロピー正則化項の暗黙の報酬

〇上田 亮1 (1. 東京大学)

キーワード:創発言語、創発コミュニケーション

本稿の主目的は、シグナリングゲーム最適化の際に用いられるエントロピー正則化項という補助目的関数に着目し、その暗黙の報酬関数を示すことにある。シグナリングゲームとは、言語創発の分野で頻繫に用いられる環境設定であり、非常に簡素なコミュニケーションモデルである。強化学習の手法を用いてシグナリングゲームを最適化する際には、エージェントの探索を補助するために、エントロピー正則化項という補助関数が用いられる。ただし、この補助関数はアドホックに導入されるものであり、そこに暗に仮定されている報酬関数は不明瞭である。また、それ故に当分野における数学的な議論が妨げられている可能性もある。そこで本稿では、エントロピー正則化項の暗黙の報酬関数を明らかにすることで、エージェントの最適化対象をより明確なものとする。また、類似した補助関数であるエントロピー最大化項との関連についても触れる。本稿の貢献が、言語創発分野における数学的な議論を発展させていく上での端緒となることを期待する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード