13:50 〜 14:10
[2P4-GS-11-02] 研究者の活動可視化に向けたウェブページの多クラス分類
キーワード:ウェブページ分類
ある特定の分野の専門家を見つけることは困難であり,多くの研究者の活動を追跡するには労力を要す.研究者の業績や関連トピックを書誌情報からまとめる研究はあるものの,研究者の専門的なキャリアに関する活動情報は,ウェブページに散在している.本論文では,そのような研究者の活動を取集するため,研究者関連ウェブページの多クラス分類を行う.ウェブページの本文テキストとURLテキストをそれぞれ事前学習された埋め込みモデルに基づく異なるニューラルネットワークを活用したモデルを提案する.構築した日本の研究者のデータセットにおいて,ベースライン手法と提案手法との性能を比較し,ウェブページ本文の特徴抽出とURL文字列の特徴抽出の組合せが有効であることを示した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。