JSAI2018

Presentation information

Oral presentation

General Session » [General Session] 2. Machine Learning

[2P3] [General Session] 2. Machine Learning

Wed. Jun 6, 2018 3:20 PM - 5:00 PM Room P (4F Emerald Lobby)

座長:木村 圭吾(NEC)

4:20 PM - 4:40 PM

[2P3-04] Data Fusion Method with Kernel Matching for Estimated Canonical Variables

〇Masaki Mitsuhiro1,2, Takahiro Hoshino3,4 (1. Nikkei Research Inc., 2. Graduate School of Economics, Keio University, 3. Department of Economics, Keio University, 4. RIKEN Center for Advanced Intelligence Projec)

Keywords:Data fusion, Kernel canonical correlation analysis, Statistical matching

異なるソースの2つの多変量データを統合する方法のひとつにマハラノビスマッチング法がある.一方のデータの欠測値に,共変量が同じもしくは近いもう一方のデータの値を代入する.しかし,共変量の数が多い場合に,次元の呪いの影響を受けるため,共変量を縮約することが有用とされる.次元縮約を行い,データを統合する正準相関分析法では,2つの多変量データの個人が同じである必要があり,個人が異なっていたとしても事前情報による個人間の関係がわかっている必要がある.本研究では,個人が異なる2つのデータを統合するため,カーネル正準相関分析法とカーネルマッチング法を組み合わせたデータ融合法を提案する.この手法は,各データにおける共変量とアウトカム変数のカーネル正準相関分析を同時に行い,共変量を共通の低次元空間に縮約する.その後,推定した正準変量に対してカーネルマッチング法を適用することで,2つのデータの共変量の偏りも考慮し,データを融合する.