Japan Association for Medical Informatics

[2-H-1-06] 汎用的なSQLを用いた匿名加工処理技術の開発

冨樫 由美子1、吉野 雅之1 (1. 株式会社 日立製作所)

Anonymization, k-anonymity, Relational Database

改正個人情報保護法や次世代医療基盤法の施行により、匿名加工された医療情報の利活用が今後一層進展していくと期待される。データベースに格納されたデータから匿名加工データを作成する方法としては、格納された生データをファイルにエクスポートして匿名加工ツールに入力する方法と、データベース内のデータをSQLを用いて匿名加工し、直接加工後データの取得を行う方法がある。後者は、生データのエクスポートが不要となるため、匿名加工にかかる工程を削減できるほか、生データファイルの安全管理対策も不要となる利点がある。報告者らは、匿名加工情報の効率的な取得を目的として、リレーショナルデータベースに対して汎用的なSQLを用いて効率的に匿名加工処理ならびに識別リスク確認処理を行い、有用性の高い加工方法をユーザに提示する技術を開発した。匿名加工データは、特定の個人を識別できる情報を削除、置換する加工処理が求められるが、どの情報をどの程度削除、置換すればよいかは一律に決まるものではない。そのため、データ加工においてはデータの個人識別リスクと有用性を考慮しながら加工方法の調整が必要になる。そこで、データ利用者の傾向として、(1)データ利用者はより元データに近いデータを求めている(質の観点)、(2)データ利用者はより多くのデータを求めている(量の観点)、(3)データの質、量のどちらをどの程度重視するかはデータ利用者によって異なる、という3つの前提を置き、k-匿名性を満たすかどうか、レコード削除許容レコード数の2つのパラメータを用いて有用性の低い加工&評価作業を省略することで、加工方法の中から有用性の高いものを高速に提示することを可能にした。ダミーデータによる処理時間の評価を行った結果、網羅的に加工&評価を行う場合と比較して、最大70%の削減効果が得られた。