一般社団法人 日本医療情報学会

[2-H-3-03] BERTを用いた医療機器不具合報告からの回収事例の推定

*石田 開1 (1. 純真学園大学 保健医療学部)

BERT, Deep Learning, Medical Device, Recall

【目的】 国内の医療機器回収は、年間約400件報告されている。また、国内の製造販売業者からの不具合報告は、年間1万件以上にのぼり、この内、100~200件が回収となる。本研究では、自然言語処理モデルの一つであるBERTを用いて、不具合内容と健康被害状況の内容から、回収事例を推定する機械学習モデルの構築を目標とした。 【方法】 厚生労働省が公表している、2008年4月1日~2022年3月31日までの国内の不具合報告99373件の内、植込み型ペースメーカおよび植込み型除細動器本体計4278件(内、回収事例:342件)を分析対象とした。本研究では、不具合報告の文章から、不具合内容と健康被害状況を学習に用いた。BERTでは、予め日本語文章をトークンに変換し、そのデータを用いて学習する。本研究では、Tohoku BERTおよびJMedRoBERTaを言語モデルに用いた。学習は、バッチサイズ128、エポック数20、10回の交差検証をおこない、再現率と適合率で評価した。なお、対象データは、回収事例の割合が10%未満の不均衡データであり、1:1のアンダーサンプリングとオーバーサンプリングを用いた比較もおこなった。 【結果】 再現率/適合率は、Tohoku BERTではオリジナルデータ:0.46、0.68、アンダーサンプリング:0.86、0.23、オーバーサンプリング:0.96、0.13だった。JMedRoBERTaでは、オリジナルデータ:0.44、0.74、アンダーサンプリング:0.84、0.24、オーバーサンプリングで0.83、0.3となった。 【考察】 オーバーサンプリングデータに対して、Tohoku BERTで学習されることにより、9割以上の再現率を達成できた。しかし、このモデルの適合率は悪く、偽陽性が多い結果となった。本研究では回収に至る事例の抽出を目的としたが、今後は更なる精度の向上を目指したい。