一般社団法人 日本医療情報学会

[2-E-1-PS1-2] レセプト情報等オンサイトリサーチセンターの現況および今後について
-これまでの進捗の報告、および今後の第三者利用について-

松居 宏樹1, 佐藤 大介2, 大江 和彦2 (1.東京大学大学院医学系研究科公共健康医学専攻臨床疫学・経済学, 2.東京大学医学部附属病院 企画情報運営部)

東京大学では、平成27年度よりNDBオンサイトセンターの運営・利用に向けたシステムの構築を行ってきた。そのなかで、我々はオンサイトセンターのパフォーマンス研究としてNDBデータの特性や抽出に必要となる処理時間などを報告してきた。
現在我々は、模擬申し出として厚労省に届け出た個別の研究課題を遂行している。模擬申し出に取り組む過程において、研究者がレセプト情報を利用する際、データハンドリングプロセスの標準化が大きな課題であることがわかってきた。
このプレゼンテーションでは、模擬申し出に取り組む中で構築した、NDBをはじめとするレセプト情報ハンドリングの標準プログラムに関してその要件・運用上パフォーマンスを報告する。
レセプト情報の研究を行うにあたり、研究に用いる情報を、年齢・性別などの患者背景情報、処方薬・処置などの処方情報、診断名をはじめとする病名情報と定義した。また、研究者がフォーカスする情報の粒度を、患者個人単位・月単位・エピソード単位・日単位と定義した。研究者が、上記の情報を適切な粒度で集計を行うためのコーディングを行うことは困難である。我々は、研究者が以下の情報を指定することで、データの抽出集計プロセスのある程度自動化している。
・特定の条件に合致するレセプトを抽出するクエリ
・必要な処方情報の一覧とカテゴリ
・必要な病名情報の一覧とカテゴリ
自動化のために作成したプログラムは、研究者が設定した条件のレセプトを抽出し、そのレセプトが算定された個人のすべてのレセプトを各集計単位で集計するバッチ処理である。集計する情報は、処方情報と病名情報をカテゴリ単位で集計し、処方情報は処方開始日、病名情報は診断開始日を集計する。
実運用においては、150万人程度の症例規模のデータを集計するのにおおよそ30時間程度の時間を有した。今後、抽出したデータを元に解析を進める。