Japan Association for Medical Informatics

[2-G-3-OP13-3] 新たなエビデンス創出のための次世代NDBデータ研究基盤構築に関する研究:新たなシステム下での検索速度等に関する評価

加藤 源太1, 酒井 未知2, 大寺 祥佑2, 下垣 徹5, 松居 宏樹3, 野田 龍也4, 康永 秀生3, 今村 知明4, 黒田 知宏2 (1.京都大学医学部附属病院 診療報酬センター, 2.京都大学医学部附属病院 医療情報企画部, 3.東京大学大学院医学系研究科 臨床疫学・経済学分野, 4.奈良県立医科大学 公衆衛生学講座, 5.(株)NTTデータ)

【背景】
レセプト情報・特定健診等情報データベース(NDB)は、医療の質向上・均てん化や日本初の医療技術の臨床開発を促進するデータとして利活用の推進が期待されているが、その推進を妨げる様々な課題も存在している。
【目的】
我々は、NDBの利活用推進に際しての課題及び解決には(A)リレーショナルデータベース(RDB)情報に特有な、硬直した構造の克服、(B)データ利用の前段階で発生する手戻りの解消、(C)研究に適したデータへの変換作業の簡略化、が必要だと考え、その解決を本研究の目的とした。
【方法】
前述の課題に対し、それぞれ(A)高速性と拡張性の両方を担保したデータ環境の実現、(B)学習・試行・適用の3段階の運用システムの構築、(C)研究に適した汎用性の高いデータマートの整備、が必要であると考え、(A)Hadoopによるリニアなスペックの拡張・容易なスケールアウトが実現できる環境の導入、(B)NDBのダミーデータを実際に操作し、分析技術を学べる学習環境の整備、(C)NDBの全データ検索やデータ再構築を行う手間が省けるよう、大凡の研究目的に対応可能な患者単位の小規模データマートの整備、に取り組むこととした。
【結果】
本発表では上記研究の概要報告を中心とするが、構築を開始した新たなシステム下において、従前のNDBデータ利用と比してデータ抽出や基礎的な分析について、操作性や処理速度の改善がどの程度みられるかについて、オンサイトリサーチセンターでの利用経験も含め、これまでのNDB個票データの抽出・分析経験に基づいて整理する予定である。
【結論】
本研究において、これまでのNDB利活用における課題の明確化とともに、それを克服するための新システムの導入やその効果検証の機会となった。