一般社団法人 日本医療情報学会

[3-E-1-02] プライバシを保護した分散データ統合システムを用いた大規模ながん検診精度管理の汎用的な利用に向けて

*宮地 充子1、渡邊 要2、樽谷 優弥1、中正 和久3、成松 宏人2 (1. 大阪大学 大学院工学研究科、2. 神奈川県立がんセンター、3. 山口大学 大学院創成科学研究科)

自治体や公的機関データベースの持つ既存の医療・健康データを大規模に統合し,解析することで,個々のデータベースに基づくデータのみでは難しい医療・健康課題の評価検討が可能となる.そのため,その利活用は公衆衛生上の重要な課題となっている.これには,データに紐づく個人のプライバシが確保され,データ所有者たる本人がその利活用に合意できる枠組みの構築が求められる.ビッグデータに関する既存研究では,オプトインでデータをサーバに収集し,サーバでプライバシを確保して効率的な解析手法を改良する研究が多い.一方,本研究課題ではデータ所有者(医療の場合は患者に相当する)に着目し,データを分散環境のまま,プライバシ保護を実現しつつ,データ解析を実現することを目標とする.本目標に沿って,耐サイバー攻撃の観点からの医療データの安全な管理方法として,分散管理されるデータを分散環境のまま,プライバシ情報を削除した医療データのみを統合する方法我々はこれまで,がん検診の精度管理をモデルに,PDDIの疫学研究と医療施策への活用を検討してきた.個人に紐づくデータは医療機関のみならず,がん検診を担う自治体や公的データベースの管理施設にも存在し,分散管理されている.ある者ががん検診で要精査となり、その後がんが発見された場合,自治体にはがん検診の結果が,医療機関には診断・治療情報が,公的機関のがん登録データベースには診断情報の一部と予後情報が記録される.これらを用いてがん検診の結果とがん登録の診断情報を突合することにより,がん検診による真のがん検出精度を算出・評価することが可能となる.しかし現状はプライバシ保護や突合精度担保に要する信頼性とコストの問題から利活用が進んでいない.これに対し,我々はPDDIを用いた統合システムを試作し,第一段階としてのダミーデータによる突合実験を実施,パフォーマンスおよび突合精度の影響評価を報告し,近年の医療機関におけるサイバー攻撃の増加を考慮し,分散環境にあるデータのプライバシを保護したデータ突合の安全性のさらなる強化を検討した.本稿では,さらに現実的なデータサイズで,ノイズとなる突合情報の不一致を備えたダミーデータセットを用いた突合実験の結果を報告するとともに,複数機関を想定した大規模ながん検診の精度管理実現の実用化に向けた具体的な実施枠組みの構想について報告する.