[4Xin2-33] 列名と値の結合特徴量に基づいた列構成の異なるテーブルデータを処理可能な深層学習方式
キーワード:テーブルデータ、深層学習、ニューラルネットワーク
製造や社会インフラなど様々な領域において収集されるテーブルデータ(表形式データ)を分析・利活用する技術への期待がある.実問題におけるテーブルデータは,データの収集拠点間の差異やデータ項目の追加などの要因により列構成が異なるデータが混在する場合がある.一般的なテーブルデータ解析手法は,入力するテーブルデータの列構成が同一であることを前提としているため,列構成の種別ごとにモデルを学習する,または,全データに共通する列のみを抽出する必要があった.これに対し,列構成が異なるデータを1つのモデルで学習できる深層学習方式としてTransTabが提案されたが,列名とカテゴリ情報である値をベクトルの集合として処理する際にその対応関係が失われ,異なる列に同一の値が出現するデータを区別することが困難になる問題があった.提案方式では,列名と値をそれぞれエンコーディングした特徴量を結合したベクトルを入力することで,異なる列に出現する同一カテゴリ値の区別を可能にした.実験により,テーブルデータの分類タスクにおいて,提案手法は従来手法と比較して16.1ポイント以上の性能向上を確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。