Japan Association for Medical Informatics

[4-H-2-03] 機械学習を用いた降圧剤・高脂血症用剤の安全性リスクの予測

*Yu Sadachi1, Azusa Hara1, Hisashi Urushihara1 (1. 慶應義塾大学 薬学部 医薬品開発規制科学講座)

Machine Learning, AI, real world data

【目的】降圧剤・高脂血症用剤の使用成績調査データベースに分散表現と深層学習(DNN)を適用することで各薬剤クラスの副作用リスクの予測を試みた。 【方法】くすりの適正使用協議会が提供する降圧剤・高脂血症用剤の使用成績調査データベースを学習に使用した。患者背景を分散表現化したものを入力、ICD-10中間分類(以降、中間分類)ごとの副作用の発生の有無を正解としてDNNを構築した。各薬剤クラスで複数のモデルを構築しF値が最も高くなったモデルをDeSCヘルスケアが提供するレセプトデータベースでテストした。 【結果】学習時の各モデルのF値の最大値はβ遮断薬で0.276と最も低く, ACE阻害薬で0.81と最も高くなった。テスト時のF値はCa拮抗薬で最小の0.13,ACE阻害薬で最大の0.26となった。中間分類ごとの予測では,ACE阻害薬のモデルでは呼吸器疾患においてF値は0.49、高脂血症用剤では消化器疾患においてF値は0.62と高い値を示した。 【考察】学習時のF値は各薬剤クラスで差が見られたが、これはクラスごとにデータ数と予測する中間分類の種類に差があったことが原因と考えられる。一方でテスト時のF値は各薬剤クラスごとに差はあったもののいずれも大きな値は得られなかった。これは学習データである使用成績調査が各薬剤クラスで因果関係を有した主要な副作用のデータ数が多く含む一方、レセプトデータは薬剤と因果関係を有さない傷病データを多く含み、これらの傷病の発生を予測することは困難なためである。予測する中間分類を限定した場合に一部の薬剤クラスで高いF値が見られたこともこれに起因する。 【結論】 モデルは主要な副作用が含まれる中間分類でのみ高い精度で予測したことから使用成績調査データを学習させることで主要な副作用の検出に特化したモデルを構築できることが示された。