2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-2 データセットとベンチマークの技術的・社会的な視点

[3K5-OS-2b] データセットとベンチマークの技術的・社会的な視点

2024年5月30日(木) 15:30 〜 16:50 K会場 (44会議室)

オーガナイザ:鈴木 健二(ソニーグループ株式会社)、原 聡(大阪大学)、谷中 瞳(東京大学)、菅原 朔(国立情報学研究所)

16:30 〜 16:50

[3K5-OS-2b-04] データ流通市場におけるデータ探索のための深層データ表現学習モデル

〇真鍋 公介1、藤田 幸久2、桑原 昌広2、早矢仕 晃章1 (1. 東京大学、2. トヨタ自動車株式会社)

キーワード:言語モデル、対照学習、データ市場

データ収集・蓄積・分析などの情報技術の発展により、異分野データ連携と利活用が注目され、分野を横断してデータを交換するデータ流通市場が萌芽しつつある。一方、データ流通市場において自身が必要とするデータを探索・発見するためにはデータ分析に関わる経験やデータ形式に関わる専門知が必要となる。また、現状のメタデータは人手による作成が主であり、記述の一貫性や解釈性は作成者の知識や経験に大きく依存する。本研究では上記課題に対して、データ本体を入力とし、データ検索のための埋め込み表現を出力するデータ表現モデルを学習する手法を提案する。その結果、既存の手法に比べデータのトピックをより正確に反映したデータ表現を取得することができることが分かった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード