18:00 〜 18:20
[2I5-J-9-03] 機械翻訳とラフセット理論を利用した特許公報分類システム
キーワード:文書分類、特許、ラフセット理論、機械翻訳、ナイーブベイズ分類
本研究では,業務で行われる特許公報の細分化を支援するため,機械翻訳とラフセット理論を利用した特許公報システムを提案する.本手法では,機械翻訳で英語に翻訳することによる表記ゆれの削減,ラフセット理論における「属性の縮約」(クラスがお互いに識別されるために必要かつ十分な属性の組)を用いることによる語句の適切な絞込み,決定ルールを用いることによる語句関係の考慮を図る.本手法では機械翻訳を行った特許公報から抽出した特定の品詞の単語から構築した文書語彙行列から,尤度表とラフセット理論に基づく決定ルールを構築する.これらを利用し,新規特許の分類を行う.提案手法の有用性を評価するために,専門家の協力のもと検証を行った結果,ラフセット理論に基づく分類,尤度表を用いたナイーブベイズ分類ともに一定の精度をあげたことから,提案手法の有用性を示せた.