10:00 〜 10:20
[3H1-GS-3-04] 類似性に基づく独立話題の追跡
キーワード:独立話題分析、話題抽出、話題追跡、テキストマイニング
話題抽出手法の一つである独立話題分析では,適用した文書データ内において互いに独立な話題を抽出することができる.しかし時間の経過に伴った独立話題の変化に関しては考慮されていない.一方でニュース記事やSNSの投稿などの文書データ内の話題は時間の経過とともに変化する.例えば,東京オリンピックに関する話題は招致の立候補に始まり,開催の決定,ロゴの問題,マラソン会場の変更のように時間とともに変化している.そこで時間の経過に伴った独立話題の変化を追跡できる方法が提案されている.その手法では時刻tで抽出した独立話題と,時刻t+1で抽出した独立話題の類似性を計算する.その類似性に基づいた話題の変化として,話題の統合,分離,出現,消滅,復活の5つを定義されている.本研究ではこの提案されている話題追跡手法を実装し,類似度指標のユーザによる評価と提案されている話題追跡手法と既存手法である単語の出現頻度による話題追跡手法との比較を行った.ユーザによる評価の結果,独立話題の類似度にはコサイン類似度が適していることが示され,それを用いた手法の比較では既存手法よりも的確に話題を追跡できることを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。