[4-F-1-07] データサイエンスを踏まえた病院情報システムにおけるデータ利活用基盤の検討
Hospital Information Systems, Database, Medical Informatics
HISデータの二次利用は臨床研究や病院経営分析などにおいて非常に有益とされている。しかし、病院情報システムはマルチベンダシステムであり、各部門システムでバラバラにデータが管理されている。そのため、データを一元的に蓄積できる統合データベースの構築が推進されている。しかし、統合データベースの構築にはデータの標準化やシステム間の接続の問題もあり、そのためには膨大な費用や時間がかかるため整備が困難という現状がある。また、これらのデータを用いて様々なデータ分析や機械学習の適用を行うには、一度データを抽出した上で別の分析システム利用する必要がある。
一方で、データサイエンスの現場においては、Python/Jupyter Notebookといった分析環境をGPUサーバー上に構築し、データ処理を行うことが一般的になっている。Jupyterは機械学習や統計手法を用いたデータ分析を容易に実施することができるオープンソースであり、実行スクリプトなどをNotebookファイルで共有できる機能を持つ。そのため、データサイエンスの中でも標準的なツールになりつつある。よって、本研究では、病院情報システム内に二次利用データベースの構築およびpython/Jupyter Notebookデータ分析環境を実装し、HISデータ二次利用の可能性について検討を行った。
具体的には、兵庫県立はりま姫路総合医療センターにおいて、病院情報システム内に二次利用データベースとしてIntersystems IRISおよびPython/Jupyter Notebook環境を構築した。具体的な利用方法としては、システム等の構築についてはIRISを利用し、アドホックな分析等については、電子カルテおよび部門システムのcsvデータ抽出システムを用いてPython/Jupyter Notebookで分析を行うことが可能になった。
一方で、データサイエンスの現場においては、Python/Jupyter Notebookといった分析環境をGPUサーバー上に構築し、データ処理を行うことが一般的になっている。Jupyterは機械学習や統計手法を用いたデータ分析を容易に実施することができるオープンソースであり、実行スクリプトなどをNotebookファイルで共有できる機能を持つ。そのため、データサイエンスの中でも標準的なツールになりつつある。よって、本研究では、病院情報システム内に二次利用データベースの構築およびpython/Jupyter Notebookデータ分析環境を実装し、HISデータ二次利用の可能性について検討を行った。
具体的には、兵庫県立はりま姫路総合医療センターにおいて、病院情報システム内に二次利用データベースとしてIntersystems IRISおよびPython/Jupyter Notebook環境を構築した。具体的な利用方法としては、システム等の構築についてはIRISを利用し、アドホックな分析等については、電子カルテおよび部門システムのcsvデータ抽出システムを用いてPython/Jupyter Notebookで分析を行うことが可能になった。