2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-1 データセットとベンチマークの技術的・社会的な視点

[1P4-OS-1b] データセットとベンチマークの技術的・社会的な視点

2025年5月27日(火) 15:40 〜 17:20 P会場 (会議室801-2)

オーガナイザ:鈴木 健二(ソニーグループ),原 聡(電気通信大学),谷中 瞳(東京大学),菅原 朔(国立情報学研究所)

15:40 〜 16:00

[1P4-OS-1b-01] コンテキスト情報を用いたデータセット埋込表現の提案:データ統合タスクへの適用と評価

〇春木 佑香1、石倉 茂2、出町 和也2、早矢仕 晃章1 (1. 東京大学大学院、2. 株式会社インフォマート)

キーワード:データ連携、スキーママッチング、埋め込み学習、深層学習

データ統合において,スキーママッチングなどのタスクは不可欠である一方で,そのコストは高く,さまざまな自動化手法が求められている.本研究では,コンテキスト情報を利用した埋め込み手法を提案し,実用・業務的データセットにおけるマッチング性能の向上を図る.本手法は,EmbDIをベースとし,Sentence-BERT によってコンテキスト情報であるカラムの説明文を活用することで,カラムの類似度に基づいたエッジを生成し,四部グラフを構築する.9つの異なるデータセットを用いた実験の結果,本手法は特に数値データをはじめとした固有表現の多いデータセットにおいて,EmbDI を上回る性能を示した.これらの結果から,コンテキスト情報を考慮した埋め込み学習が高精度なスキーママッチングに有効であり,より正確なデータ統合の実現に寄与することが示唆される.本研究により,実世界のデータ統合環境においては,コンテキストに関するメタデータを考慮することの重要性が示された.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード