一般社団法人 日本医療情報学会

[2-J-1-01] ヒトの心拍変動指標の個人識別性ー機械学習を用いたサル指標との比較

*湯田 恵美1,2、金子 格1,3、早野 順一郎4,1、平原 大助1 (1. 東北大学 大学院情報科学研究科, 2. 東北大学 未来科学技術共同研究センター, 3. 東北大学 加齢医学研究所, 4. 株式会社 ハートビートサイエンスラボ)

Animal ECG, Heart Rate Variability , Personal identifier, Machine learning

本研究では,サルとヒトの心拍変動指標について,機械学習アルゴリズムを用いた識別を行った.具体的には,t分布型確率的近傍埋め込み法(t-SNE)および非線形非パラメトリック次元削減法であるUMAPを用いて,心拍変動指標の特徴を可視化して,識別可能性を検証した.
 解析では,平均心拍数の近いサルとヒトの心拍間隔データを収集して,それぞれの心拍変動指標の特徴抽出を行った.次に,t-SNEとUMAPを用いて心拍変動指標の特徴を2次元空間にマッピングして可視化した.結果,心拍数の近いサンプルにおいては,サルとヒトの心電図を識別することが困難であることを明らかにした.
本研究の結果から,心拍数が近い場合には,単純な視覚的な特徴や次元削減手法だけでは,サルとヒトの心拍変動指標を識別することができない可能性があることが示唆された.これは,心臓の力学的な拍動メカニズム(力学モデル)が同じ場合には,心拍変動指標は類似した特徴を持ち,サルとヒトであっても従来手法で識別することが難しいことを示唆している.
今後の展望としては,より多くのサンプルデータを収集し,さまざまな特徴量を組み合わせたアプローチを検討する.
データの混在やマスキングは,個人識別情報を保護するための手法として一般的に使用されており,データセットには,個人を特定できる情報や個人識別子が含まれないようにする必要がある.一般的には,匿名化やデータの集約,ランダム化,ノイズの追加などの手法が使用されているが,これらの手法によっても,統計的な解析やデータマイニングなどによって個人が特定されるリスクは完全に排除することはできない.本研究の結果は,機械学習手法の限界を示唆しており,心電図解析や生物医学研究において重要な示唆を与えるものである.