Japan Association for Medical Informatics

[4-G-1-02] 診療情報利活用のためのSS-MIX2ストレージを対象としたデータバリデーション手法の提案

*Masami Mukai1,2, Katsuya Tanaka2,1, Ryota Eguchi3, Shou Takamatsu3, Hiroaki Hasegawa3, Naoki Mihara1 (1. 国立研究開発法人国立がん研究センター中央病院医療情報部, 2. 国立がん研究センター 情報統括センター, 3. 株式会社ファインデックス)

FUSE(File System in User Space), FDW(Foreign Data Wrapper), VDB(Virtual Database), SS-MIX2, CDM(Common Data Model)

【背景・目的】近年リアルワールドデータの利活用が注目され診療データの多目的利用を前提とした大規模な症例収集研究が行われている。医療機関の診療データを二次利用するには、機密性、信頼性、患者横断的検索機能等の要件が存在する。機密性を実現するために外部への提供時に症例のフィルタリング機能を備える必要がある。また、信頼性を担保するために病院情報システム側基盤とデータ収集用ストレージのバリデーションを行う必要があるが、ストレージが検索を前提とした構造ではないことから処理時間等の課題があった。 そこで、今回データフィルタリング機能および患者横断的検索機能を備えたデータバリデーション処理基盤を検討したので報告する。【方法】仮想DB技術の1つであるFDW(Foreign Data Wrapper)を利用し、FUSE(File System in User Space)を備えたSS-MIX2ストレージ(以降、FUSEサーバ)と電子カルテDWHを透過的に参照可能な環境を構築した。FUSEサーバのデータ構築処理に症例フィルタリング機能を実装した。【結果】症例フィルタリングの条件は、臨床研究対象患者、検診患者等とした。当院登録患者約10万件のうち、フィルタリング対象の症例数は約3.2万人であった。収集した症例を対象にデータバリデーション処理基盤上で患者基本情報および病名データを検証した。検証にかかった時間は、構築システムで約40分、電子カルテDWHとSS-MIX2サーバ間手動比較では約5時間であった。【考察】検証処理において本構築システムの方が従来手法より有用であることが示唆された。FDWのpushdown機能を利用しデータマッピングを実現することで、カルテベンダのDWHの差異をカバーし、個別のレポジトリが要求するCDM(Common Data Model)によるバリデーション環境を構築できると考える。