[2-E-1-02] クレームデータベース利活用の現場から:できること・できないこと・意外にできたこと
Claims Database, NDB, feasibility and difficulty in claims database research
クレームデータベース (claims database) は行政データ (administrative database) とも呼ばれ、対象患者または医療機関における医療専門職の診断、医療行為に基づく請求書がデータベース化されている。日本における最大のクレームデータベースはレセプト情報・特定健診等情報データベース(NDB)であり、近年、利用が広まっている。
研究情報源としてのクレームデータベースにはいくつかの批判もある。主たる批判の中で、レセプト病名の低信頼性については疾患定義技術の向上で回避の目途が立ちつつあるが、因果推論(例:Aの原因はBである、Xを投与したらYになる)の難しさについては現時点では技術向上の初期段階と考えられる。
2022年時点でクレームデータベースが最も得意とする統計分野は粗集計(単純集計)である。特にNDBは全国網羅性(ほぼ悉皆性)を有するため、ある疾患の全国の受療率算出などの粗集計では最初に考慮すべき情報源のひとつとなりつつある。たとえば、発表者らはNDBを用いたアレルギー性鼻炎の疾患定義を開発することで、アレルギー性鼻炎の受診者数が年間2300万人に及び、そのうち83%が季節性アレルギー性鼻炎であることなどを初めて算出した。
一方、クレームデータベースでは検査値や疾患の重症度、患者背景の一部または全部の情報が欠落している。現在、欠落していない情報から欠落した情報を補う統計学的な試みが進められているが、一般的な多変量解析や因果推論は結果の解釈に相当な保留をつけざるを得ない段階である。また、クレームデータベースは、発症から診断までの時間の個人差が大きい場合や、処方直後に使用されない薬剤が存在する場合(内服薬の残薬や外用薬など)では分析設計に難渋することがある。
本発表では、特にNDBを例に、クレームデータベースが得意な分析、不得意な分析や、集計設計の工夫により意外にうまくいった分析を実例とともに示し、NDB分析技術の現状を報告する。
研究情報源としてのクレームデータベースにはいくつかの批判もある。主たる批判の中で、レセプト病名の低信頼性については疾患定義技術の向上で回避の目途が立ちつつあるが、因果推論(例:Aの原因はBである、Xを投与したらYになる)の難しさについては現時点では技術向上の初期段階と考えられる。
2022年時点でクレームデータベースが最も得意とする統計分野は粗集計(単純集計)である。特にNDBは全国網羅性(ほぼ悉皆性)を有するため、ある疾患の全国の受療率算出などの粗集計では最初に考慮すべき情報源のひとつとなりつつある。たとえば、発表者らはNDBを用いたアレルギー性鼻炎の疾患定義を開発することで、アレルギー性鼻炎の受診者数が年間2300万人に及び、そのうち83%が季節性アレルギー性鼻炎であることなどを初めて算出した。
一方、クレームデータベースでは検査値や疾患の重症度、患者背景の一部または全部の情報が欠落している。現在、欠落していない情報から欠落した情報を補う統計学的な試みが進められているが、一般的な多変量解析や因果推論は結果の解釈に相当な保留をつけざるを得ない段階である。また、クレームデータベースは、発症から診断までの時間の個人差が大きい場合や、処方直後に使用されない薬剤が存在する場合(内服薬の残薬や外用薬など)では分析設計に難渋することがある。
本発表では、特にNDBを例に、クレームデータベースが得意な分析、不得意な分析や、集計設計の工夫により意外にうまくいった分析を実例とともに示し、NDB分析技術の現状を報告する。