2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-2 機械学習

[1Q2-J-2] 機械学習: 強化学習の展開

2019年6月4日(火) 13:20 〜 15:00 Q会場 (万代島ビル6F会議室)

座長:吉野 幸一郎(NAIST) 評者:宮口 航平(日本IBM)

13:20 〜 13:40

[1Q2-J-2-01] 強化学習と模倣学習の融合による人間らしいエージェント

〇ドッサ ルスラン1、連 欣瑜1、野本 洋一2、松原 崇1、上原 邦昭1 (1. 神戸大学、2. 株式会社エクォス・リサーチ)

キーワード:強化学習、模倣学習、人間らしさ

強化学習では,収益の最大化を目指して訓練することで,様々な課題が解決できる.しかしながら,ゲームAIや自動運転などに応用する際,エージェントが強すぎてユーザを不安にさせたり,周囲の状況を考慮せずに動くことがあるため危害を加える恐れがある.一方で,模倣学習では、エキスパートのデータ上でエージェントを訓練することで,そのエキスパートを模倣することができる.ただし,振る舞いが不自然であったり性能がエキスパートの性能に限られる場合がある.本論文では,離散行動空間と連続行動空間に適用可能な強化学習と模倣学習の融合モデルを提案する.この融合モデルは,単なる模倣学習のエージェントと比較して高い性能を示し,強化学習モデルより人間らしい振る舞いを学習することができた.