[4-G-2-04] データの利活用に向けたナショナルセンターの
電子カルテ情報統合データベース構築におけるデータ整備の試み
Standardization, Clinical Databese, Real World Data
国立高度専門医療研究センター 医療研究連携推進本部(JH)では、電子カルテ情報を活用したリアルワールドデータ収集・提供基盤の構築事業(JASPEHR)にて臨床情報データベース(6NC-EHRs)を構築している。6つのナショナルセンター(NC)の電子カルテからSS-MIX2/MCDRSを用いてデータを集積しているが、NC毎に標準化の対応状況が異なっており、二次利用推進のためにはデータの品質向上が必要不可欠であった。そこで、2022年5月時点でのデータを用いて品質評価と標準コードへの変換等作業を実施した。
データの検証は、まずSS-MIX2標準仕様準拠状況・NC間のデータ突合・値の欠損等を全180項目に渡って多角的に調査した。標準化対応は、各項目コードに関するローカルコードマスタを基にNC毎の標準コード対応表を作成し、ローカルコードを置換した。また必要に応じ、SS-MIX2で未定義のコードに対し、6NC-EHRsDB共通コードを定義し統一を図った。
検証の結果、作業開始時点では4施設(622,162名・206,703,005レコード)の標準コード対応状況はYJコード98.5%・HOT9コード64.5%、JLAC10コード77.3%、ICD-10コード99.5%・病名管理番号73.1%であった。更に問題の切り分けをし、性別等必須項目の抜けや薬品名のみ漏れているといったケースは、ベンダに調査・対応を依頼した。また標準コードへの置換では、あるNCでYJコードが振られていない196,416レコード中196,019レコード(99.7%)を標準化対応できた。
これらの結果、現時点で9割程度標準コードの付与が可能と推定している。今後更に向上すべく、継続的にクリーニングを実施する。また問題点をNCやベンダにフィードバックし、我が国の医療情報におけるリアルワールドデータの品質向上に努める。
データの検証は、まずSS-MIX2標準仕様準拠状況・NC間のデータ突合・値の欠損等を全180項目に渡って多角的に調査した。標準化対応は、各項目コードに関するローカルコードマスタを基にNC毎の標準コード対応表を作成し、ローカルコードを置換した。また必要に応じ、SS-MIX2で未定義のコードに対し、6NC-EHRsDB共通コードを定義し統一を図った。
検証の結果、作業開始時点では4施設(622,162名・206,703,005レコード)の標準コード対応状況はYJコード98.5%・HOT9コード64.5%、JLAC10コード77.3%、ICD-10コード99.5%・病名管理番号73.1%であった。更に問題の切り分けをし、性別等必須項目の抜けや薬品名のみ漏れているといったケースは、ベンダに調査・対応を依頼した。また標準コードへの置換では、あるNCでYJコードが振られていない196,416レコード中196,019レコード(99.7%)を標準化対応できた。
これらの結果、現時点で9割程度標準コードの付与が可能と推定している。今後更に向上すべく、継続的にクリーニングを実施する。また問題点をNCやベンダにフィードバックし、我が国の医療情報におけるリアルワールドデータの品質向上に努める。