[4-G-2-02] SS-MIX2標準化ストレージ内に蓄積されたRWDの信頼性と課題
SS-MIX2, Real World Data, Electrical health records, Data Quality, Data Validation
【目的】近年、電子化された医療データ(以下、RWD)の二次利用が期待されている。一方で、各種ストレージに蓄積されたRWDのデータ品質について確認する手段がないことが多く臨床研究への利活用促進の妨げの1つとなっている。本学では、臨床研究中核病院に付随する枠組みの中で、SS-MIX2標準化ストレージ(以下、SS-MIX2)を用いたRWDの二次利用を行うための基盤構築に取り組んできた。本研究の目的は、過去に実施した本学SS-MIX2データの品質検証で明らかになった不備を可能な限り改修した前後で、SS-MIX2データと病院情報システム(以下、HIS)の意味的同等性を評価し、その変化を明らかにすることである。【方法】我々が開発したデータ品質検証ツールを用い、SS-MIX2の11データ種別、303項目の意味論的な一致率を算出した。具体的には、検証の対象として過去の1か月分のデータをSS-MIX2、HISよりそれぞれ抽出→データ項目ごとに、データを1件1件ツール上で突合→意味論的に一致している件数を算出→当該データ項目の全データ数を基に一致率を計算、という手順で行った。【結果】改修前後で、100%一致率は84.5%→87.8%、90%以上一致率は97.4%→99.7%と増加していることがわかった。加えて、不一致項目の調査では、検証ツールの問題、SS-MIX2の仕様の問題、HIS内のイレギュラーデータ、マスタ設定不備、SS-MIX2送受信プログラムの不備などが原因であることが確認された。【結語】解決すべき課題は残るものの、データ検証、原因究明、対応、再検証のサイクルを通じた品質検証の取組みがSS-MIX2データ品質向上に有用であることを示唆していると考える。HISのような病院独自の運用が行われているシステムから得られるRWDを臨床研究に用いるためには、継続的な品質管理活動が必要である。