文章に基づいたLinked Data整備を支援する上での言語的特徴の抽出

奥村 雄輝

12:20 〜 12:40

[4M2-GS-5-02] 文章に基づいたLinked Data整備を支援する上での言語的特徴の抽出

〇奥村雄輝¹、廣川佐幸男²、竹内和広¹ (1. 大阪電気通信大学、2. 九州大学)

キーワード：リンクドデータ、コンテンツ作成支援、オントロジー、情報抽出

固有表現と意味役割は文章生成・理解において中核的な役割を担う。
Wikipedia文書とそれと整合する形で整備されたLinked DataであるWikidataとの組は、構造化された知識と、文章中の固有表現に対して特定の意味的役割を与える言語的特徴との対応を知る上で、重要な研究資源である。
本稿では、Wikidata上でproperty-value関係を持つvalue値が表出する言語表現を調査する。
具体的には、当該propertyを表現する上での特徴となる言語表現を、SVM(Support Vector Machine)を用いた素性選択手法を適用して明らかにする。
さらに、それらの特徴的な言語表現が、一つの説明文章の中に低頻度で出現し、性質の異なるpropertyを説明する文章と明確に区別できることを確認した。
この知見は、文章でproperty-valueが記述されているにも関わらず、Wikidata上でproperty-valueが設定されていない不整合を是正することに役立つことを示す。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4M2-GS-5] Webインテリジェンス

[4M2-GS-5-02] 文章に基づいたLinked Data整備を支援する上での言語的特徴の抽出

パスワード