Japan Association for Medical Informatics

[4-D-3] SDM(標準化されたDWH)における品質確保に関する検討

島川 龍載1 (1. 県立広島大学)

SDM (Standardized Data Warehouse), Quality of Clinical Data, ER diagrams

筆者らは2017年に一般社団法人SDMコンソーシアムを設立し、DWHの標準化を目指したSDM(Semantic Data Model)を公開し、医療情報学会等でその運用に関する課題の検討と導入効果について報告を行ってきた。一方、SDMユーザ数の増加とともに、新たなデータの品質に関する課題が顕在化してきた。具体的には、SDMに格納されるデータの意味や定義に関する品質が、SDMの導入医療機関あるいは納品業者によって左右されることがあるという事実である。このような現象は他の標準規格の活用時にも起こり得る現象であるが、広域に収集した医療データを用いたビッグデータ分析を行う際には確保されるべき必須要件である。本企画では、SDMの品質確保に関する検討結果を報告し、具体的な施策を提案する。

SDMは、データの定義や意味を統一して保存する規格である。その利点として複数の医療機関におけるデータの統合、あるいは分析手法の互換性が挙げられる。また医療情報学会においても、異なる電子カルテシステムから作成されたSDMの充足度と共通項目に関する報告などを行ってきた。しかし、ベンダー共通の項目であっても、定義や意味が合致していなければ、分析対象の項目にはならない。

筆者らは、今回SDMの品質確保に関する検討を行った結果、SDMにおいては、電子カルテからのデータ抽出・変換・加工(ETL)処理精度の違いにより、データの精度、頻度、粒度に差異が生ずることを明らかにした。またSDMの定義に関する解釈の違いや誤解により、SDMの品質が低下する可能性も示唆された。

本企画では、SDMの品質低下をもたらす要因の解析結果を報告し、施策としてのETL検証方法、およびSDMのサンプルデータの有効性に関して提言する。また、品質確保に関するSDMコンソーシアムの今後の取り組みについても言及する。