[3Rin4-54] ラフ集合理論とRT法を用いた文書分類手法の提案
キーワード:ラフ集合理論、文書分類、RT法
自然言語処理の代表的な課題である文書分類に対し,本研究では,ラフ集合理論と品質工学の手法であるMT法の1つのRT法を用いた手法を提案する.本手法では,はじめに訓練文書から頻度を基に抽出した語句とラベルとを結合することで決定表を構築する.この決定表から縮約を求めた後,下近似から決定ルールを抽出する.この決定ルールと訓練文書を照合し,照合したルールの評価値に基づき構築した単位空間サンプルから,分類ごとに単位空間を構築する.ルールの評価値としては,正確度,被覆度,支持度,リフト値,定数のいずれかを用いる.新規文書の分類推定においては,新規分類を同様の方法で分類対象サンプルに変換後,単位空間との距離を求める.得られた距離が最小の分類を回答とする.本手法の有用性を検討するために,先行研究で対象としてきた特許公報を題材に,専門家の協力のもと検証を実施した.検証の結果,十分な有用性を示すには至らなかった.今後の課題としては,検証を通して得られた問題点に対応するよう改良し,異なる文書を対象とした検証を行うことである.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。