2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-2 機械学習

[3K4-J-2] 機械学習: 実環境との相互作用

2019年6月6日(木) 15:50 〜 17:30 K会場 (201A 中会議室)

座長:木村 大毅(日本アイ・ビー・エム株式会社) 評者:梶野 洸(日本IBM)

16:10 〜 16:30

[3K4-J-2-02] 動的報酬クラスタリング

〇比嘉 亮太1、加藤 淳也1 (1. NEC)

キーワード:時系列データ、強化学習、模倣学習、報酬設計

実世界の時系列データは、人間の操作によって様々なパターンを持つ。我々の目的は、アクションとの時系列データからの貴重な情報の抽出である。また、我々は時系列データから人々の方針を解釈する必要がある。我々は、時系列データから動的な報酬をクラスタリングするための解釈方法を提案する。シンプルなWavelet変換による前処理ととクラスタリング技術を組み合わせることで、人間のモーションデータや倒立振子のシミュレーションのデータセットに対して、我々のアプローチは時系列情報を保持したまま異なる報酬と機能の解釈可能のクラスタリングに成功した。