[3-B-2-07] 大規模症例データベースから肝不全症例を抽出するアウトカム定義の開発
phenotyping algorithm, Liver failure, Medical information database network (MID-NET)
【目的】本邦の大規模症例データベースのうち、医療情報データベース(以下、MID-NET)を用いて肝不全(急性肝不全及び遅発性肝不全)症例を抽出するスクリプト(以下、アウトカム定義)を開発し、その精度を検証した。
【方法】MID-NETに集積された診療データ(構造化データ)を用いて、2013年1月から2017年12月に本院を受診した患者を対象とした。①DPC傷病名(以下、病名ベース)を条件としたものと、専門医の見解に基づき肝不全の病名登録がない潜在的肝不全症例を抽出するために検体検査結果(以下、検査値ベース)を中心とした計2種類の初期アウトカム定義を作成し、該当症例を抽出した。②病名ベース、検査値ベースから計200症例をランダムサンプリングし、判定基準に従って1症例につき2名の専門医が独立して真偽を判定した。③Gradient Boosting Decision Treeにより示された重要変数を新たに真症例の抽出条件に追加する等により初期アウトカム定義を修正した。各定義の妥当性指標として陽性的中度(PPV)、ケース内感度(真偽判定を実施した症例内の感度)を算出した。
【結果・考察】病名ベースの初期アウトカム定義はPPV 75.0%であったが、検査ベースではPPV 0%と真症例が抽出されなかった。そのため、検査値ベースに関しては、病名ベースを合わせた全200症例の中から「傷病名」を抽出条件に使用せずに病名ベースの真症例を予測する変数を追加する手法で初期アウトカム定義を修正した。最終的には、病名ベース:PPV 93.5%、ケース内感度96.7%(F値:0.951)、検査値ベース:PPV89.7%、ケース内感度86.7%(F値:0.881)まで精度を向上させることができた。本研究はPMDAを代表とするAMED事業の一環であり、今回の修正版アウトカム定義は複数施設にて妥当性が検討される予定である。
【方法】MID-NETに集積された診療データ(構造化データ)を用いて、2013年1月から2017年12月に本院を受診した患者を対象とした。①DPC傷病名(以下、病名ベース)を条件としたものと、専門医の見解に基づき肝不全の病名登録がない潜在的肝不全症例を抽出するために検体検査結果(以下、検査値ベース)を中心とした計2種類の初期アウトカム定義を作成し、該当症例を抽出した。②病名ベース、検査値ベースから計200症例をランダムサンプリングし、判定基準に従って1症例につき2名の専門医が独立して真偽を判定した。③Gradient Boosting Decision Treeにより示された重要変数を新たに真症例の抽出条件に追加する等により初期アウトカム定義を修正した。各定義の妥当性指標として陽性的中度(PPV)、ケース内感度(真偽判定を実施した症例内の感度)を算出した。
【結果・考察】病名ベースの初期アウトカム定義はPPV 75.0%であったが、検査ベースではPPV 0%と真症例が抽出されなかった。そのため、検査値ベースに関しては、病名ベースを合わせた全200症例の中から「傷病名」を抽出条件に使用せずに病名ベースの真症例を予測する変数を追加する手法で初期アウトカム定義を修正した。最終的には、病名ベース:PPV 93.5%、ケース内感度96.7%(F値:0.951)、検査値ベース:PPV89.7%、ケース内感度86.7%(F値:0.881)まで精度を向上させることができた。本研究はPMDAを代表とするAMED事業の一環であり、今回の修正版アウトカム定義は複数施設にて妥当性が検討される予定である。