[4-D-3-05] SDMの品質管理計画
SDMは、診療データの二次利用に適したデータモデルとして一般社団法人SDMコンソーシアムにより開発され、質の保証を含めて管理されている。SDMが標準化DWHを目指す理由は、同一定義のデータを広域に亘って収集できること、および分析手法が同じであれば、その成果は多くの施設で享受できること、というこの二点にある。標準化DWHの要件として、ベンダー共通のデータが定義され、その充足度が高いこと。データの品質、すなわち粒度、頻度、精度が一定であることが求められる。充足度を改善する施策については前回報告した。今回の企画では、SDMの品質の向上に関する問題提起とその改善に関して論ずる。特に筆者は、SDMコンソーシアムの立場から、提起された問題の解決策に関して提言を行う。
まず、診療データの発生源は、ベンダーが提供する医療情報システムにユーザーが入力したデータであり、SDMにおける抽出元は、医療情報システムで保存されたデータということになる。SDMでは、ETL(抽出、変換、登録)処理により、保存されたデータを抽出し、SDMが定義したデータに変換後、DWHとして登録している。このETLを設計するには、抽出元の定義およびSDMの定義を熟知していなければならない。筆者は多くのシステムからのETL設計を行ってきたが、実際は抽出元のDB定義だけでは不充分であり、ユーザーの入力過程におけるワークフローや業務知識が不可欠であった。このスキルを共有し、SDMの品質向上に役立てるため、以下の会員向けサービスを開始することとなった。
「ETL設計の検証」、「ETL構築に関するアドバイス」、「ETL開発者のための教育コースの開設」
本企画においては、上記サービスの詳細な内容と、その実施した効果に関して報告するとともに、SDMコンソーシアムの今後の活動とSDMロードマップについても紹介する。
まず、診療データの発生源は、ベンダーが提供する医療情報システムにユーザーが入力したデータであり、SDMにおける抽出元は、医療情報システムで保存されたデータということになる。SDMでは、ETL(抽出、変換、登録)処理により、保存されたデータを抽出し、SDMが定義したデータに変換後、DWHとして登録している。このETLを設計するには、抽出元の定義およびSDMの定義を熟知していなければならない。筆者は多くのシステムからのETL設計を行ってきたが、実際は抽出元のDB定義だけでは不充分であり、ユーザーの入力過程におけるワークフローや業務知識が不可欠であった。このスキルを共有し、SDMの品質向上に役立てるため、以下の会員向けサービスを開始することとなった。
「ETL設計の検証」、「ETL構築に関するアドバイス」、「ETL開発者のための教育コースの開設」
本企画においては、上記サービスの詳細な内容と、その実施した効果に関して報告するとともに、SDMコンソーシアムの今後の活動とSDMロードマップについても紹介する。