Japan Association for Medical Informatics

[3-F-1-06] 臨床研究用データリソースの品質管理

*Tomohisa Seki1, Satomi Nagashima1, Kazuhiko Ohe1 (1. 東京大学医学部附属病院企画情報運営部)

Electronic Medical Record, Datawarehouse, Big Data, Database, Data Quality Assessment


電子カルテのデータベースにもとづく臨床研究を行う際には、リアルタイムで稼働している電子カルテデータベースを対象とするのではなく、二次利用目的に再構成されたデータリソース(DWH等)を構築し、それを対象にデータ抽出及び解析を行う。その理由は、リアルタイム業務処理にレスポンス上の影響を与えたくないこと、また、研究目的にデータ抽出するためにはテーブル構成を再編成し、個々のデータ形式を必要に応じて変換したりコードを標準化したりする必要があるからである。このプロセスでは単にデータ形式やコードの変換だけでなく、研究に使用するデータ項目のもつ意味を理解した上で、必要な情報を意味的に正しく構成できるように、元の複数データ項目からデータを取り出し変換や結合をして新しいデータを作成する必要もある。
 このようなデータベースの再構築は、電子カルテベンダーやDWHベンダーにより病院ごとに開発されたソフトウエアにより処理されることが多いが、この過程は非常に複雑であり、結果として構築された研究用のデータベースが、元のデータのもつ値や意味的な情報を正しく保持しているかどうかを検証する必要がある。しかし、その検証手法は確立していないだけでなく、検証結果としてのデータベースの品質をどのような指標で評価すべきかについても指針が存在していない。
 SWG4ではこの観点から、以下の4つのテーマについて検討を実施している。
1) 汎用的リソースとしてのSS-MIX2標準化ストレージのバリデーション
2) 2つのデータリソースからのFHIR準拠オブジェクト同士の意味的な検証
3) 臨床研究に使えるデータベースの品質指標の検討
4) 電子カルテ関連ベンダーとの二次利用データ品質管理手順の作成
 本SWGは本年7月に設置され、一部のテーマを引き継いで活動を始めたばかりである。発表では上記の4つについて進捗状況を報告したい。