2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-3 データマイニング

[4B2-J-3] データマイニング: 構造とクラスタ

2019年6月7日(金) 12:00 〜 13:20 B会場 (2F メインホールB)

座長:真矢 滋(東芝) 評者:宮口 航平(日本IBM)

12:40 〜 13:00

[4B2-J-3-03] MT法を用いたk-means法の初期値設定法の提案

〇西垣 貴央1、田口 隼平1、小野田 崇1 (1. 青山学院大学)

キーワード:クラスタリング、k-means、MT法

k-means は一般的によく用いられるクラスタリング手法である.k-means では似ているデータ同士が同じクラスタになるように小さいクラスタを生成する.k-means は初期クラスタ中心が全データからランダムに選択されるため,選択された初期クラスタ中心によっては生成されるクラスタが異なる問題がある.また初期値外れ値が初期クラスタ中心に選択されると,生成されるクラスタが似ていないデータ同士で構成され,大きなクラスタを作ってしまう問題も存在する.この2つの問題を解決するために,k-meansの初期クラスタ中心の選択方法の研究は数多く行われていが,同時に解決する方法は存在しなかった.そこで本研究の目的は,この2つの問題を同時に解決する方法を提案することである.提案する方法は,MT法を用いて初期値外れ値を除き,最も遠いデータを初期クラスタ中心とする.提案した方法の有効性を検証するために.人工データとベンチマークデータに適用し,従来手法と比較を行った.その結果,提案手法は,初期値外れ値を初期クラスタ中心に選択することなく,生成したクラスタはより小さなクラスタとなっていることが確認できた.