[4Xin2-15] 時間別閲覧傾向から明らかにするWikipedia記事の性質
キーワード:アクセスログ、クラスタリング、Webマイニング
インターネット上にはブログやネットニュース、動画など様々なコンテンツで溢れている。メディアはそれらの視聴数に応じた収益を獲得するため、できるだけ多くの視聴数を稼げる戦略を常に探求している。一方で視聴者は日々のスケジュールに沿った活動をし、時間帯にあったインターネットの利用をしているため、必然とコンテンツには時間的な特性が生じる。この時間特性を明らかにすることはメディアの配信するタイミング戦略に大きく貢献することが期待される。本研究ではWikipediaで公開されている記事の閲覧数の履歴を利用して、それぞれの記事やユーザが持つ時間的性質を明らかにする2つの手法を提案する。まず記事の概要に自然言語処理を経て画一的なジャンルを付与し特定の時間に人気のジャンルを抽出できることを示し、次に記事の時間別閲覧傾向に独立成分分析を施しユーザグループの時間特性を明らかにする。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。