Japan Association for Medical Informatics

[2-I-3-2] 医療データ駆動型研究を推進する医療データ収集システムの構築と導入効果

芦崎 晃一1,2, 川崎 洋1,2, 川上 英良1,2, 重水 大智1,3, 桜田 一洋1, 角田 達彦1, 海老原 全2, 天谷 雅行2 (1.理化学研究所 医科学イノベーションハブ推進プログラム, 2.慶應義塾大学医学部皮膚科学教室, 3.国立長寿医療研究センター メディカルゲノムセンター 臨床ゲノム解析推進部)

医療分野におけるデータ駆動型研究を推進するためには、匿名加工した大量の医療データを迅速に収集し、抽出されたデータを高い品質で管理することが求められる。しかしながら、過去の医療データ収集過程には、電子カルテから転記するデータ生成や抽出工程に手作業が多く含まれ、シームレスに自動収集するシステムが十分に整備されていなかった。そのため、ロースループットであると同時に、解析用に生成・収集したデータの再現性が担保されていないことが課題として挙げられていた。そこで、今回我々は、慶應義塾大学病院内の診療データウェアハウス(DWH)から医療データの抽出・加工・転送(ETL)を自動化したシステムを構築した。本システムは、収集したデータを解析用にデータクレンジングする機能や、電子カルテ上の患者IDから研究で使用される匿名化IDへの自動変換機能を有する。構築した本システムを実稼働し、医療データ収集基盤としての実用性を検証した。医療データの取り扱いを考慮し、オプトアウトを行使した患者の除外、個人識別情報の削除、マスキング処理などの加工処理が正常に機能していることを確認できた。また、2012-17年に同院に通院したアトピー性皮膚炎患者を対象に、本システムのETLの処理時間を計測したところ、のべ14,265 人・91項目・約50万件のデータが約4時間で収集可能であることが確認された。本システムを導入したことで、毎週、医療データが自動で収集され、収集工程における人的負担の軽減と収集データの再現性および品質の向上が得られた。今後、ETLの処理時間の高速化と収集効率を向上させる本システムを、他疾患データへ拡張し、他施設とのシステム連携を実施することにより、医療ビッグデータ解析研究の推進に繋がることが期待される。