9:00 AM - 10:40 AM
[4Pin1-15] Determination of Column Concepts in Tables using Multi-label Classification and Knowledge Base Embeddings
Keywords:Table, Knowledge Base, Multi-label classification
テーブルは一般に関係性を表現する表現形式であり,知識ベースに接続されていないため,検索などの用途でテーブルを活用することができない.テーブル中の列の概念決定は,列に対して知識ベースの中の1つの概念(エンティティ)を対応づけることであり,これによって意味的な関係を用いた検索が効率的にできるようになる.本論文では,(1) マルチラベル分類と知識ベースの埋め込みを用いて,列ごとに列に対応するエンティティを決定する手法と,(2) マルコフ確率場を用いて複数の列に対応するエンティティを同時に決定する手法を提案する.列中の各要素がエンティティに対応づけられるNE列と,対応づけられないリテラル列とに分けて,それぞれの列に合わせたマルチラベル分類器を用意し,列に対応するエンティティを推定する.また,マルコフ確率場によってテーブル中の要素や列間の関係を表現することによって,このマルコフ確率場の同時確率を最大化することによって各列に最適なエンティティを推定する.UCI Machine Learning Repositoryにある183のテーブルとWordNetを用いて,提案手法の有用性を示す.