Japan Association for Medical Informatics

[4-G-3-03] NDBに含まれるid5の名寄せ精度の検証

*Tomoaki Imamura1, Tomoya Myojin1, Yuichi Nishioka1, Tatsuya Noda1 (1. 奈良県立医科大学医学部)

NDB, ID integration, cohort study

【目的】本研究では、NDB(National Database)に2022年4月審査分のレセプトから付与された最古の個人単位被保険者番号等に基づく名寄せIDであるid5の長期追跡性を検討する。また、id5が付与される前のデータについて、既存のidとのより精緻な名寄せの可能性も検討する。
【方法】2013年4月~2023年3月診療分のNDBデータのうち、医科・DPCレセプトのREレコードのid1n、id2、id5及び診療年月を用いた。各月のid5の格納状況をDPC・医科入院・医科入院外に分けて集計・分析した。そしてid1n/id2/診療年月から既報の方法でid0を作成し、対応するid5が存在する場合はid0をid5で上書きしてid0nとした。
【結果・考察】DPCの約95%、医科入院の約92%、医科入院外の約97%のレセプトに有効なid5(16進数64桁の値)が含まれていた。それ以外はnullまたは9であった。id0とid5を比較したところ、ユニークなid5の合計はユニークなid0の合計より約3.5%少なかっていた。これは、id0が名寄せ不十分な可能性はあるものの、id5がnullの数で約3.5の差を補完できることから、id0もid5とほぼ同等の名寄せ精度を示している可能性も示唆された。次に、2013年4月診療分に存在したid0/id0nに対し、2023年3月まで存在するidを追跡した結果、いずれも約80%の捕捉率であったが、id0に比べてid0nのほうが捕捉率は高かった。また、id1nとid2が同一だがid5が異なるケースが約12万件、id5が同一だが性別又は生年月が異なるケースが約33万件存在した。これらはid5の異常かもしれないが、全レセプトの0.5%未満で、NDB分析には大きな支障がないと考えられた。
【結論】本研究では、id5の設定状況と長期追跡性を評価し、id0とid5を組み合わせた新たなid0nの開発を行った。今後、死亡者を除外するなど、id5およびid0nの精度をさらに検証していく必要がある。
【倫理的配慮】本研究は奈良県立医科大学の倫理審査を受けて実施され、NDBデータを用いた分析結果は厚生労働省および社会保険診療報酬支払基金の公表物確認を受けている。