12:00 〜 12:20
[4J2-GS-2-01] アンサンブル最近傍距離を用いたラベル無しデータからの分類器学習
キーワード:教師無し学習、半教師あり学習、ラベル無し分類学習、アンサンブル推定、最近傍距離
様々な分野においてビッグデータを分類するニーズが増えているが,多くの場合ラベル付き事例集合を得ることが難しく,分類問題を教師あり学習法で解くことが困難である.そこでラベル無し事例集合のみを用いて分類器を構築するアルゴリズムの1つであるUUC(Unlabeled-unlabeled Classification)を考える.UUCの先行研究では,2クラス分類問題においてクラス割合の異なる2つのクラス無し事例集合から,ガウスカーネルを用いた密度比ないし密度差の推定により分類器を学習するアルゴリズムが主である.しかしカーネル法を用いると学習データ量に関する計算量やメモリコストがかかり,ビッグデータを分類する場合には適さない.本提案手法は,クラス割合の異なる2つの事例集合各々について特定の個数だけランダムサンプルした標本集合を得て,分類したい事例とこれら2つの標本集合各々との最近傍距離を求める.この操作を多数回行ってアンサンブル平均を取ることにより近似的に密度差を評価し,クラス分類を行う.この手法はそのコストが学習データ量に依存せず,クラスラベル無しビッグデータから高効率な2クラス分類を行える.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。