Japan Association for Medical Informatics

[2-D-1-02] Cancer Screening Study Using a Privacy-Preserving Distributed Data Integration System

*ATSUKO MIYAJI1,2, Yuntao Wang1, Kazuhisa Nakasho3, Kaname Watanabe4, Hiroto Narimatsu4 (1. Osaka University, 2. JAIST, 3. Yamaguchi University, 4. Kanagawa Cancer Center)

big data, PSI, PDDI, privacy-preserving classification protocol

ビッグデータの解析結果は新製品開発など様々な活用が期待され,ビッグデータ解析・利用の促進は重要である.医療分野においては,患者のプライバシを確保しつつ,患者の医療情報を医療分野の発展に利活用できることが望まれる.さらに,データ所有者である患者がデータの利活用に合意できる枠組みの構築が必須である.ビッグデータに関する既存研究では,ビッグデータの効率的な解析手法を改良する研究が多い.一方,本研究課題ではデータ所有者(医療の場合は患者に相当する)に着目し,データのプライバシ保護を実現しつつ,データ解析を実現することを目標とする.本目標に沿って,耐サイバー攻撃の観点からの医療データの安全な管理方法として,分散管理されるデータを分散環境のまま,プライバシ情報を削除した医療データのみを統合する方法PDDI (Privacy-Preserving Distributed Data Integration)を開発した.
医療データを用いた疫学調査では,同一患者のデータ突合の重要性は高い.患者のデータは個々の受診医療機関のみならず,健診を担う自治体や医療関連データベース管理施設等にも分散管理されている.ある者ががん検診で要精査となり、その後の精査でがんが発見された場合,自治体にはがん検診の結果が,医療機関には診断・治療情報が,公的機関のがん登録データベースには診断情報の一部と予後情報が記録される.これらは補完関係にあり,例えばがん検診結果とがん登録の診断情報を突合することにより,がん検診による真のがん検出精度を算出し,改善のための精度管理を行うことが可能となる.しかしながら,実際の突合においてはデータの表記揺れによる不一致などのため,その利活用は容易ではない.
本稿では,PDDIシステムの今後の発展として,クラウドの利用への発展,実用的なパフォーマンスへの改修,曖昧データへの展開,また,医療データ活用の例として,効率的かつ大規模ながん検診の精度管理実現に向けたPDDI適用における結果と今後のさらなる活用に向けた展開について報告する.