2024年度 人工知能学会全国大会(第38回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[4Xin2] ポスターセッション2

2024年5月31日(金) 12:00 〜 13:40 X会場 (イベントホール1)

[4Xin2-33] 列名と値の結合特徴量に基づいた列構成の異なるテーブルデータを処理可能な深層学習方式

〇山本 晋太郎1、安藤 純平1、渡邉 航1、小野 利幸1 (1.(株)東芝)

キーワード:テーブルデータ、深層学習、ニューラルネットワーク

製造や社会インフラなど様々な領域において収集されるテーブルデータ(表形式データ)を分析・利活用する技術への期待がある.実問題におけるテーブルデータは,データの収集拠点間の差異やデータ項目の追加などの要因により列構成が異なるデータが混在する場合がある.一般的なテーブルデータ解析手法は,入力するテーブルデータの列構成が同一であることを前提としているため,列構成の種別ごとにモデルを学習する,または,全データに共通する列のみを抽出する必要があった.これに対し,列構成が異なるデータを1つのモデルで学習できる深層学習方式としてTransTabが提案されたが,列名とカテゴリ情報である値をベクトルの集合として処理する際にその対応関係が失われ,異なる列に同一の値が出現するデータを区別することが困難になる問題があった.提案方式では,列名と値をそれぞれエンコーディングした特徴量を結合したベクトルを入力することで,異なる列に出現する同一カテゴリ値の区別を可能にした.実験により,テーブルデータの分類タスクにおいて,提案手法は従来手法と比較して16.1ポイント以上の性能向上を確認した.

要旨・抄録、PDFの閲覧には参加者用アカウントでのログインが必要です。参加者ログイン後に閲覧・ダウンロードできます。
» 参加者用ログイン