15:50 〜 16:10
[3N5-GS-11-02] 学術情報に関するSNS言及を用いたネットワーク分散表現の特徴分析
キーワード:Twitter、arXiv、metapath
機械学習に関する論文は指数的に増加しており、SNS上でもarXivなどのプレプリントサーバー上で公開されている学術論文が多くシェアされている。これらの論文は査読前で学術的な質は担保されておらず、SNSの投稿に含まれるタイトルや紹介文から読者のスキルやニーズにあった論文を見つけ出すことは難しい。 本研究では、Twitter上のリツイートとarXivを紐付けた情報を用いて、SNS上の言及に基づいたネットワークを構築し、これにmetapath2vecと呼ばれる手法を用いることで、学術論文の特徴を表すような分散表現を同時に獲得する。従来研究では、共著関係など学術的に閉じたネットワークを対象としているが、SNSユーザーと学術論文が混在するネットワークを利用することで、SNSユーザーの嗜好性を反映した学術論文の分散表現が得られた。また、プレプリントなど被引用数が少ない論文において、引用関係を元にした手法などと比較し、類似する文書の探索やクラスタリングの計算などで良好な結果が得られた。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。