Japan Association for Medical Informatics

[4-H-3-05] 観察研究に資するRWD収集におけるCDMの意義

*Eizen Kimura1 (1. Ehime University)

RWD, CDM, Data Quality

電子カルテからアーカイブされた素のデータのままではデータ品質が低いこと、分析のためのデータベースに構成するプロセスにも影響を受けることが知られている。そのため、研究コミュニティでは分析データベースの標準スキーマすなわちCommon Data Model (CDM)について合意形成し、CDMに連動したETLツール、統制用語集、データ品質評価ツールを開発して共有することで、CDM上に展開する医療情報の品質向上に取り組んでいる。この研究者コミュニティに閉じていたCDMを仮想的に統合して大規模なデータエンクレーブを構築するイニシアチブがある。コロナウィルスに関する研究を加速するために、The National COVID Cohort Collaborative (N3C)はフェノタイピングのロジック定義に合意した後、ACT、PCORnet、OHDSI、TriNetXといった研究コミュニティで開発された4種のCDMに対してフェノタイピングのロジックを移植することで、既存の組織やデータモデルを超えて再現性のある情報抽出と分析に取り組んでいる。
 わが国では電子カルテからのアーカイブとしてSS-MIXが第一選択肢となっているが、各研究班における分析データベースのスキーマ、ETLツール、品質管理ツールがオープンソース等で公開的にレビュー・改善する取り組みがないため、N3Cに見られるように既存の分析基盤を統合して新たな分析基盤を仮想的に実現する土壌に乏しい。次世代相互運用交換規約FHIRが注目を浴びているが、臨床研究のためにFHIR Profileを設計するにあたり従来のHL7 2.xベースのデータ収集時代にはなかった統制用語集の制約、バリデーションを意識し、先行している研究者コミュニティによるCDMにおけるFHIRをデータソースとする取り組みに合流する視点を検討すべきであると思われる。