[4Xin2-84] Wikipediaカテゴリと定義文を利用した記事のクラス分類
キーワード:Wikipedia、クラス分類、構造化知識、カテゴリ
Wikipediaには、様々な事物に関するデータが記述されているが、知識工学的な観点からは構造化されていない。多くのWikipediaからの構造化手法では、主に、記事のクラス分類とその属性付与という形での構造化が行われている。Wikipediaカテゴリはこの記事のクラス分類に貢献することが期待されるが、様々な目的でカテゴリが付与されるため、クラス分類に適切なカテゴリのみに絞り込むことは容易ではない。一方、機械学習の方法では、定義文などに注目したクラス推定の手法が提案されているものの、クラスごとにその性能が大きく異なっている。本研究では、人間が付与したデータであるカテゴリと、各記事の主題を定義する定義文を組み合わせたクラス分類の手法を提案する。具体的には、定型的に記述されることの多い定義文から、クラスを代表するような単語・句(定義語)を抽出する方法を提案し、カテゴリと組み合わせることでクラス推定を行う。また、本手法を「森羅プロジェクト」のクラス分類タスクに適用した結果について報告する。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。