Japan Association for Medical Informatics

[4-I-1-02] 医用画像に対する匿名加工処理の自動化に関する検討

*Katsuya Tanaka1,2, Yamato Kamiko3, Ryota Eguchi3, Yukie Okada2, Seiichi Yoshimoto2 (1. 国立がん研究センター情報統括センター, 2. 国立がん研究センター中央病院, 3. 株式会社ファインデックス)

Medical Images, Secondary Use, Data Anonymization

背景:個人情報保護の観点から、後ろ向き観察研究などの医用画像二次利用にあたっては、収集した検査画像に対して、個人識別符号等を漏れなく匿名加工処理する必要がある。DICOM画像であっても、患者誤認防止を目的として、画像領域内に患者氏名や生年月日が印字されているケースがあり、超音波検査(US)や内視鏡検査(ES)などでは、セカンダリキャプチャ(SC)と同様に個人識別情報が印字されている事例は散見される。また、検査画像情報の枚数規模が多いため、精度のよい自動加工処理手法が求められる。方法:本研究は、以下の手順で行う。Microsoft社製~~を使用して、他院持ち込み画像としてCD/DVDに含まれる各種検査画像に対して文字認識処理を施し、各種モダリティごとに、検査画像内の文字出現形態、印字位置、識別された文字列の意味、などを調査・分析し、検査画像に対して高精度な自動匿名加工を実現するための実装方法を検討する。結果:他院画像は、提供元医療機関や装置メーカによってさまざまな形態があり、DICOMタグ情報の有無、DICOMタグ情報の記載作法にもばらつきがある。DICOMタグとして、Burned In Annotation Attribute Tag (0028,0301)が全検査の1割程度しか使われておらず指標として使えないこと、また、今回の手法では、画像内に焼きこまれた文字認識処理に対して、画像内の臓器部分にあたる模様から文字が認識される、英字だけでなくマルチバイト文字が混在して誤検出される、といった検討課題が存在することが分かった。考察:試行結果から、検出する文字の大きさや位置に対してある程度の検出制約を設けること、DICOMタグ情報から患者識別情報を参考値として検証すること、検査シリーズ単位に画像を畳み込むことで常時出現する文字を抽出する、といったロジックを包含することで、高精度な自動匿名加工処理における認識精度の向上が期待できると考えられた。