17:30 〜 17:50
[2S6-OS-7a-01] 臨床研究DXの試み
脳卒中リスク因子のテキスト構造化システム
キーワード:医療言語処理、大規模言語モデル、情報抽出、電子カルテ、マルチタスク学習
電子カルテに蓄積されたテキストから患者の既往歴や検査結果を抽出(テキスト構造化)できれば予後予測などの臨床研究に応用できることから,自然言語処理(NLP)技術は盛んに適用され,臨床研究のデジタルトランスフォーメーション(DX)に貢献している.既往研究ではテキストから抽出したい医学的項目の性質に応じて固有表現抽出や文分類などの異なるNLPモデルを組み合わせており,持続的なメンテナンスに課題があった.本研究では単一のNLPモデルで多数の項目を抽出できる手法の開発を目的に,脳卒中リスク因子のテキスト構造化に取り組んだ.提案手法は大規模言語モデルの一種であるT5を項目ごとにマルチタスク学習させた単一のNLPモデルであり,血圧などの検査値の抽出タスクと喫煙・飲酒の有無といった識別タスクの両方を解くことができる.実験では,異なるマルチタスク学習方法の効果を比較するとともに,リスク因子項目ごとの性能を評価した.抽出タスクはF1値0.8以上の実用的性能を得たが,識別タスクの性能は低いのが課題である.臨床研究DXを目指し,本手法を内蔵したテキスト構造化GUIアプリを運用しながら改善を進めている.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。