09:20 〜 09:40
[4A1-GS-10-02] 大規模言語モデルによる日本語電子カルテの治療中止理由分類
キーワード:大規模言語モデル、副作用、電子カルテ、リアルワールドデータ
電子カルテには、副作用・有害事象を含む治療中止の経緯が自由記述として蓄積されているが、既存のデータベースにはこうした情報が十分に構造化されておらず、抽出が難しいため、これらの情報はその価値は非常に大きいものの十分に活用しきれていない。本研究では、大規模言語モデル(LLM)を用いた自動ラベリングと少数の手動アノテーションを組み合わせ、副作用・有害事象由来の治療中止を効率的に分類することを目的とした。約6,256件のLLM付与ラベルと200件の手動ラベルを統合し、JMedRoBERTaおよびT5をファインチューニングしたうえで100件のテストデータで評価した結果、T5モデルでは精度(Precision)が0.83と高かったものの、再現率(Recall)は0.25にとどまった。特に副作用を見逃すリスクは臨床上深刻であり、さらなる学習データの拡充が望まれる。将来的には他の中止要因(患者希望によるものや治療効果不十分など)への拡張も検討し、実臨床での活用を目指す。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。