臨床研究画像収集システムを用いた機械学習のための大規模臨床画像データ収集の試み

岡田 佳築

[3-I-3-01] 臨床研究画像収集システムを用いた機械学習のための大規模臨床画像データ収集の試み

*岡田佳築^1,2、杉本賢人²、和田聖哉²、小西正三^1,2、松村泰志³、武田理宏^2,1 (1. 大阪大学医学部附属病院, 2. 大阪大学大学院医学系研究科, 3. 国立病院機構　大阪医療センター)

Medical Image Collection System, Machine Learning, Clinical Research

我々は臨床研究における画像収集効率化を目指し、画像の選択、匿名化、送信を自動化する臨床研究画像収集システム構築を進めてきた。本システムでは、患者ID、検査日、画像検査モダリティ情報を登録し、院内PACS内の対象画像をDICOMタグ情報から自動的に収集することが可能であり、機械学習のための大規模画像データ収集も可能である。しかしながら、大規模データを収集する際の実運用時の課題については検討が不十分であり、今回、実例を踏まえて、大規模画像データ収集時の課題について検証を行った。2016年～2020年の5年間で当院において心エコーを施行した患者の前後1ヶ月以内の胸部X線正面像の収集依頼を受け、病院情報システムから、期間中に心エコーを施行した患者ID、心エコー実施日、条件に合う直近の胸部X線実施日の情報を抽出した。その後、患者IDと胸部X線実施日のリストを作成し、画像検査モダリティを「CR」とした収集条件を臨床画像収集システムに登録した。登録症例数は13,180例で、夜間のみ本システムを稼働させ、5日間で24,097枚のDICOM画像が収集された。症例毎に1枚の胸部X線正面像が要望であったが、要望に合致する画像は13,156枚（54.6%）であり、それ以外は胸部X線の重複が7,197枚（29.9%）、胸部以外のX線の重複が3,554枚（14.7%）、対応する胸部X線正面像がない24症例の画像が190枚（0.79%）であった。重複した画像が収集された要因は、同日の胸部複数回・複数方向撮影、同日の胸部以外の部位撮影であり、収集後に「検査部位」や「シリーズ時間」等の別のDICOMタグ情報から画像の絞り込みを行う必要があった。今後、本システムを用いて大規模画像を正確に収集する為には、詳細な収集条件設定が可能なシステムの改善や、収集後に別手法で画像の絞り込みを行う事が必要であると考えられた。

第43回医療情報学連合大会（第24回日本医療情報学会学術大会）

[3-I-3-01] 臨床研究画像収集システムを用いた機械学習のための大規模臨床画像データ収集の試み