Japan Association for Medical Informatics

[4-G-2-05] Elasticsearchを用いてSS-MIX2標準化ストレージのデータを患者横断的に高速全検索できるデータ解析基盤の構築

*Tomohiro Mitani1, Jun Okamoto2, Satomi Nagashima1, Shunsuke Doi1, Kazuhiko Ohe1,2 (1. 東京大学医学部附属病院, 2. 東京大学大学院医学系研究科)

SS-MIX2, Data Warehouse, Document Database

【背景】SS-MIX2標準化ストレージ(以下、SS-MIX2)は着実に普及している。しかし、SS-MIX2はシステムや病院間の連携やデータバックアップなどに用いられているものの、臨床研究などでの二次利用にはさらに活用の余地がある。また、SS-MIX2は患者番号を最初の分類キーにするフォルダ構成がとられているため、患者横断的な検索を効率よく行うには別のデータベース(DB)への変換が必要になる。一方、最近JSONドキュメントを扱うドキュメントDBが発展してきている。今回、SS-MIX2データをJSONに変換してドキュメントDBに格納し、多目的に効率よく全検索できるシステムを構築し性能を評価した。【方法】ドキュメントDBとしてオープンソフトのElasticsearchを用い、パソコン3台でクラスターを構築した。SS-MIX2内のHL7v2.5メッセージデータはオブジェクト構造や繰り返し構造を持っており、そのデータ構造を保ったままJSON化することができる。各エレメント名をオブジェクトに割り当ててJSON化するスクリプトを作成し、SS-MIX2データをJSON化して、Elasticsearchにインデックスした。なお、SS-MIX2に加え、手術情報や診療録、入退院詳細などは電子カルテデータベースから取得するようにカスタマイズした。【結果】東大病院における約13年分の約39万人の患者データから「AST>100の検査結果数」、「アムロジピン処方歴のある患者一覧」などの検索は概ね数秒以内に終了し、データ解析目的としては十分なパフォーマンスであった。【考察】ElasticsearchはSS-MIX2を患者横断的に全検索する二次利用基盤として非常に有望であった。JSON形式はHL7 FHIRでも用いられる形式であり、将来的にはこの解析基盤にFHIRリソースも取り込みたい。