2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 3.データマイニング

[1P1] データマイニング-データマイニング応用(1)

2018年6月5日(火) 13:20 〜 15:00 P会場 (4F エメラルドロビー)

座長:成松 宏美(NTT)

13:20 〜 13:40

[1P1-01] 一般化相対二乗誤差に基づく低確率事象強調サンプル法

長谷川 博1、〇中村 文美1、鷲尾 隆2 (1. 茨城大学理工学研究科、2. 大阪大学産業科学研究所)

キーワード:サンプリング法 、一般化相対誤差、低確率事象 、大偏差理論 、Wang-Landau法

この論文では、大規模データからのデータサンプリングの手法について議論している。我々は、低確率事象を強調するために、一般化相対誤差を導入し、その誤差を最小にする最良のサンプリングの重みを導出する。我々の議論は、大偏差理論を基礎としている。最良のサンプリングの重みに対して、一般化相対誤差が大きく減少することを、実際の数値実験で確認した。我々は、またデータサンプリングにWang--Landau法を用いることも提案する。Wang--Landau法は、元データの分布の効率的な推定に有用なだけでなく、統計誤差を抑制する。