Japan Association for Medical Informatics

[3-J-5-04] Data Warehouseへ格納されたReal World Dataの品質検証

*Akemi Morohashi1, Satoshi Yamashita1, Takahiro Imaizumi1, Yachiyo Kuwatsuka1, Masahiko Ando1, Yoshimune Shiratori1 (1. 東海国立大学機構 名古屋大学医学部附属病院)

Data Warehouse, Real-World Data, Data Quality, Validation, Reliability

研究自体の質は、その計画や用いるデータ品質によって決定づけられる。一方、医学系研究に用いるReal World Data(RWD)の品質に関する報告は乏しく、信頼性のあるReal World Evidence(RWE)創出のためには、その礎となるRWDの品質を明らかにする必要がある。【目的】広く医療機関で使用されているData Warehouse(DWH)に着目し、そこへ格納されたRWDの品質を評価する。【方法】Data Management Association が提唱する信頼性を示すための評価軸から正確性・完全性・一貫性・適時性・一意性・有効性を採用した。それらを定量的に評価するための手法を検討し、データ入力源となるシステム(HIS)とDWHへ格納されたデータの件数や内容について突合検証を実施する方針とした。比較対象は、観察研究に汎用される項目(患者基本・病名・薬剤・検査等)から選定し、それらのデータがどのシステムから入力され、どういった条件下で、どの経路を経てDWHへ格納されているか、任意の1ヶ月分を対象に調査した。【結果】病名情報では、データ重複はなく、最新のデータがDWHへ格納されていた。一方、データ件数の一致率は99.7%であり、DWHへ連携されていないデータの存在が明らかとなった。また、その他の比較対象でも類似の事象が見つかった。患者基本情報では、テストデータなどの無効なデータをDWHへ格納しない仕様と定義しているが、施設内運用を起因とする規定外の無効データをHISが多数含有していることが判明し有効性の検証が困難であった。【結論】6つの評価軸におけるRWDの品質を定量化する手法を一部実証することができたと考える。このような検証が広く行われていくことで二次利用を想定したデータ入力の運用検討も進み、信頼性の担保されたRWEの創出がより活発になるであろう。