一般社団法人 日本医療情報学会

[2-F-1-01] 医療情報における差分プライベートなk匿名化について

山本 章人1、木村 映善2、*渋谷 哲朗1 (1. 東京大学、2. 愛媛大学)

Differential Privacy, k-anonymity, privacy

k-匿名化は匿名化データを医療データ等から作成するにあたって最も重要な概念の一つである。k-匿名化することによって、データソース中のあるひとつのデータを特定することをできないようにすることができる。しかしながらこのk-匿名化は攻撃者がデータの背景知識をまったくもっていないことを仮定している。一方差分プライバシーはそのような背景知識を持った攻撃者からも安全な強力なノイズ加工手法である。しかしながらこの手法はk-匿名化で考慮しているようなデータの特定に関しては考慮していない。そのため、そのk-匿名化と差分プライバシーの双方を考慮した手法の開発が必要となっている。その双方を考慮した既存の手法の多くはランダムサンプリングに基づく手法となっており、データソース全体を公開することを考えた手法は知られていない。本研究ではk-匿名化と差分プライバシーの双方を満たしながらデータソース全を匿名化して公開する手法を提案し、その実効性を実医療情報上で評価する。