*飯田 征昌1、*山ノ内 祥訓2、*内村 祐之3、*鈴木 英夫4 (1. 蒲郡市民病院、2. 熊本大学病院、3. 東京医科歯科大学、4. SDMコンソーシアム)
セッション情報
チュートリアル
[TS6] チュートリアル6
二次利用ユーザーのためのデータ抽出、変換、登録(ETL)作成のスキル習得を目指して
2024年6月13日(木) 16:00 〜 17:30 第3会場 (2F 会議室202A)
オーガナイザー:本多 正幸(千葉大学)
座長:本多 正幸(千葉大学)、山ノ内 祥訓(熊本大学)
主催:SDMコンソーシアム
一次利用ユーザーがそれぞれの医療情報システムに入力したデータは、各アプリケーションがデータベース(DB)内に独自の定義で一次データとして保存し、一次利用ユーザーは、各アプリケーションを通してデータを参照することができる。しかしSDMなど二次利用ユーザー向けの共通DWHを導入していない施設は、二次利用のために、独自定義の一次DBからデータの抽出、変換、登録(ETL)が必要となり、ユーザーが自身でETLを作成することは難しく、多くの場合外部に委託するなどしてデータを取得している。また、SS-MIX2など標準化出力や独自定義のDWHを利用することができたとしても、一次保存されているデータの一部しか取得できないため、二次利用に必要なデータが十分に得られない場合もある。したがってETL を外注する場合のコストを考慮すると、ETL作成のスキルを内部で所有することが重要と思われる。
本チュートリアルでは、ETL作成の実例を紹介することにより、ETLスキルを習得してもらうため、1.標準化出力であるSS-MIX2からDWHへのETL、2.電子カルテからDWHへのETL、3.ヘルスケア・デバイスからDWHへのETL、4.電子カルテから仮想DWHへのETL、について事例を紹介する。それぞれ抽出元は違うが、登録先のDWHは、二次利用のための共通データモデルであるSDMとしている。また、各事例においては、オープンソースであるPython、PostgreSQL、あるいは、Microsoft Officeなど一般的なソフトウエアを利用しているため、受講者の環境での試行や修正も可能となる。本チュートリアルでは、ETL作成の作業量、費用感、課題、問題点などを理解し、DWH購入やETL外注における調達仕様書作成のスキルが習得できることを目的とする。