Japan Association for Medical Informatics

[3-C-2-02] プライバシを保護した医療データ利活用システムについて

宮地 充子1 (1. 大阪大学)

big data, PSI, PDDI, privacy-preserving classification protocol

各機関で独立に保管される医療情報を新薬開発や治療法の改善、健康診断結果の追跡による保健指導などに利活用することは重要である。その際、異なる機関が保管する同一患者のデータを突合できることは必須である。しかしながら、医療機関において独立に管理された医療情報を患者の名前、住所などの機微情報を漏らすことなく、突合することは容易ではない。我々の提案するデータ突合システムPrivacy-preserving Distributed Data Integration(PDDI)はプライバシ情報の漏洩を懸念することなく、複数の機関で独立に管理されたデータの突合を可能とする。本方式では、どの医療機関も共通の患者以外の情報は一切入手することができない特徴を持ち、対象がわかっているデータベースのクエリとは本質的に異なる。また、医療機関がデータベースを統合する必要がないため、独立・分散してデータを保管可能である。

一方、プライバシ保護秘匿データ解析プロトコルでは、データ解析の対象である患者の医療情報、および解析モデルの両者をお互い秘匿しながら医療情報の解析結果を患者が得ることができる。このプロトコルは誤り訂正符号理論に基づいており、量子計算機の攻撃に対しても安全に線形関数によるデータ解析を行うことができる。既存の誤り訂正符号理論に基づいた線形関数の秘匿データ解析プロトコルは紛失通信というコストの大きい構成要素を必要としていたが、本プロトコルでは紛失通信を利用しない効率的な構成となっている。

また、今回、PDDIソフトウェアの全面的な設計見直しと、Pythonによる再実装を行ったので報告する。従来ソフトウェアは、通信部分がボトルネックであり、ネットワークを介して突合を行う場合にパフォーマンスの劣化が見られたが、本実装ではそれらを大幅に見直し全体的なパフォーマンス向上を行った。また、ソフトウェアのインストールも、Dockerコンテナ上に配置可能としたため簡易に環境構築が可能となった。