[3-D-2-02] 放射線レポートの二次利用に向けた構造化システムの開発に関する取り組み
Radiology Reports, Data Ware House, Natural Language Processing, Secondary Use
【背景】 放射線レポートには読影医が記述した診断における重要な情報が記述されており,この情報は,臨床研究や診断支援システムなど様々な分野での活用が期待されている.このような背景から,我々は放射線レポートを構造化された形式に変換し,それらを利活用するための基盤となるシステムの構築に取り組んできた.我々の先行研究では,機械学習を用いて,事前に定義した要素に関する用語をレポートから抽出し,それらを高い精度で構造化することに成功している.しかし,抽出した情報をどのような形で蓄積し,利活用するべきかについての設計/及び構築に関して依然として課題として残っていた.
【方法】 まず,病院に蓄積されている放射線レポートのデータベースから抽出プログラムを用いて,CSV形式でデータをエクスポートする.CSVファイルから対象のモダリティに条件を絞って,DWH内にインポートする.インポートされたレポートについて,先行研究で開発した構造化システムを用いて,情報抽出を行う.尚,現時点では格納先のテーブルとして,患者情報や画像のメタ情報にレポートの「所見・確信度」の情報を付与したテーブルと更に自由度が高い解析を可能とするためJSON形式でデータを格納したテーブルの2つを用意した.これらの一連の処理は,定期的にバッチ処理により実行され,差分追加の形でデータを蓄積していく.放射線レポートを構造化形式に変換する機能はPythonを用いて作成し,データベースについてはPostgreSQLを採用した.
【結果】 現在,大阪大学医学部附属病院の他施設DWHサーバ上で本環境を構築し,テストフェーズまでが完了した.現在,運用に向けた準備を進めている.
【結語】 放射線レポートの幅広い二次利用に向けて,レポートの内容を構造化する変換モジュールを開発し,その運用に向けたシステムを設計・開発した.
【方法】 まず,病院に蓄積されている放射線レポートのデータベースから抽出プログラムを用いて,CSV形式でデータをエクスポートする.CSVファイルから対象のモダリティに条件を絞って,DWH内にインポートする.インポートされたレポートについて,先行研究で開発した構造化システムを用いて,情報抽出を行う.尚,現時点では格納先のテーブルとして,患者情報や画像のメタ情報にレポートの「所見・確信度」の情報を付与したテーブルと更に自由度が高い解析を可能とするためJSON形式でデータを格納したテーブルの2つを用意した.これらの一連の処理は,定期的にバッチ処理により実行され,差分追加の形でデータを蓄積していく.放射線レポートを構造化形式に変換する機能はPythonを用いて作成し,データベースについてはPostgreSQLを採用した.
【結果】 現在,大阪大学医学部附属病院の他施設DWHサーバ上で本環境を構築し,テストフェーズまでが完了した.現在,運用に向けた準備を進めている.
【結語】 放射線レポートの幅広い二次利用に向けて,レポートの内容を構造化する変換モジュールを開発し,その運用に向けたシステムを設計・開発した.