14:20 〜 14:40
[2O3-J-13-04] 極性を考慮したリスク発見に向けた因果関係ネットワークの構築
キーワード:因果関係、テキストマイニング、文章極性
決算短信の因果関係ネットワークを構築する実験を行った.因果関係を決算短信から抽出し,表現の類似度を算出してネットワークを構築した.類似度の計算には日本語版ウィキペディアのコーパスから作成したword2vecモデルを使用し,単語の重要度を表すidf値の組み合わせることで,単語ベクトルから因果関係表現のベクトルを獲得した.また、極性辞書を用いて因果表現の極性の反転を捉えることで,word2vecモデルにより同一視される対義語と類義語による違いを検出した.実験によってネットワークから,因果関係どうしを結ぶ100個のエッジを無作為に選択し、目視により評価した。 その結果、妥当な接続と考えられる割合は84%であり、さらにその中で極性の反転が正しく捉えられたエッジの割合は86%であった。