分散医療情報分析基盤の秘密計算適用可能性の検証

木村 映善

[2-H-3-OP11-3] 分散医療情報分析基盤の秘密計算適用可能性の検証

木村映善¹, 濱田浩気², 諸橋玄武², 千田浩司², 岡本和也³, 真鍋史郎⁴, 武田理宏⁴, 三原直樹⁵, 黒田知宏³, 松村志⁴ (1.愛媛大学大学院医学系研究科博士課程医学専攻社会・健康領域医療情報学講座, 2.NTTセキュアプラットフォーム研究所, 3.京都大学医学部附属病院医療情報企画部, 4.大阪大学大学院医学系研究科医療情報学, 5.国立がん研究センター中央病院)

【背景】
i2b2は、各施設が公開可能なデータを各施設で保有・管理するアーキテクチャである。必要に応じて各所にクエリに集計結果を統合する仕組みが標準的に備えられている。さらにセキュリティを高めるためにi2b2ノード群を仲介し、監査を実現するSHRINEも提案されている。しかし、SHRINEは統計開示制限を行う前のデータを各ノードからAggregatorに渡すために、Aggregatorへの信頼が必要であること、自組織以外の組織群の結託によるデータの暴露に対して脆弱である。本研究はAggregatorが不要な完全分散モデルにもとづく秘密計算をi2b2に実装し、実証実験を実施する。
【方法】
三大学にVPNで相互接続されたi2b2ノードを設置し、合計3000人の患者、各患者に性別、年齢、HBA1c、CR、eGFR、尿蛋白、CKD重症度、施設番号の8項目からなる24000件のダミーのobservation
factを投入した。筆者らが2015年に開発したSDC付き統計量の算出可能な秘密計算エンジンをi2b2各ノードに組み込んだ。
【結果】
最大値の計算では全体処理44.27秒、うちデータ読込17.81秒、相関係数・検定の計算では全体処理128.81秒、うちデータデータ読込16.73秒となった。i2b2を介さず直接データを読み込んだ場合は0.1秒未満であり、データソースとしてのi2b2のオーバーヘッドの大きさが確認された。
【考察】
i2b2の読出が遅いものの全体処理時間は実用的水準に達している。i2b2のテーブル設計は多様なデータを保持できるようなカラム指向設計となっており、複数条件を指定したクエリに対して最大限の効率性を発揮するような設計になっていない可能性がある。i2b2のクエリ最適化と実データの投入時の本邦の標準医療情報マスタとの整合性処理、性能評価等詳細な解析を進める予定である。

第37回医療情報学連合大会（第18回日本医療情報学会学術大会）

[2-H-3-OP11-3] 分散医療情報分析基盤の秘密計算適用可能性の検証