ウェブから能動学習の観点で有益なデータを取得する

佐藤 竜馬

14:00 〜 14:20

[4L3-GS-4-01] ウェブから能動学習の観点で有益なデータを取得する

〇佐藤竜馬^1,2 (1. 京都大学、2. 理化学研究所)

キーワード：ウェブマイニング、能動学習

能動学習はラベルの付いていないデータのプールの中からラベルを付けるべきデータを繰り返し選択することでラベル付けのコストを削減することを目指す技術である。プールからデータを選択するための基準は多くの手法が提案されている。しかし、どのようにプールを構築するかについてはあまり検討されておらず、ほとんどの手法はタスクに特化したプールが無償で利用できることを前提としている。本論文では、タスク特化のプールが常に利用できるとは限らないことを提唱し、ウェブ上にある無数のラベルなしデータを能動学習のためのプールに利用することを提案する。問題は、プールが非常に大きいため、全てのデータの獲得関数を網羅的に計算することができないことである。本研究では、ユーザサイドの検索アルゴリズムを用いてウェブ上から能動学習の観点から有益なデータを効率的に取得する手法を提案する。実験では、オンラインFlickr環境を能動学習のプールとして用いる。このプールは100億枚以上の画像を含んでおり、既存の能動学習用プールに比べて数桁大きい。提案手法は既存の小規模なプールを用いた手法よりも優れたパフォーマンスを示す。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4L3-GS-4] Webインテリジェンス

[4L3-GS-4-01] ウェブから能動学習の観点で有益なデータを取得する

パスワード