2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-7 医歯薬学・生命科学の革新を目指した言語処理

[2S6-OS-7a] 医歯薬学・生命科学の革新を目指した言語処理

2024年5月29日(水) 17:30 〜 19:10 S会場 (52研修交流室)

オーガナイザ:矢田 竣太郎(奈良先端科学技術大学院大学)、荒牧 英治(奈良先端科学技術大学院大学)、河添 悦昌(東京大学)、堀 里子(慶應義塾大学)

17:30 〜 17:50

[2S6-OS-7a-01] 臨床研究DXの試み

脳卒中リスク因子のテキスト構造化システム

〇大槻 優佳1、大塚 皇輝1、矢田 竣太郎1、若宮 翔子1、荒牧 英治1、尾原 信行2、吉江 智秀3 (1. 奈良先端科学技術大学院大学、2. 神戸市立医療センター中央市民病院脳神経内科、3. 国立循環器病研究センター)

キーワード:医療言語処理、大規模言語モデル、情報抽出、電子カルテ、マルチタスク学習

電子カルテに蓄積されたテキストから患者の既往歴や検査結果を抽出(テキスト構造化)できれば予後予測などの臨床研究に応用できることから,自然言語処理(NLP)技術は盛んに適用され,臨床研究のデジタルトランスフォーメーション(DX)に貢献している.既往研究ではテキストから抽出したい医学的項目の性質に応じて固有表現抽出や文分類などの異なるNLPモデルを組み合わせており,持続的なメンテナンスに課題があった.本研究では単一のNLPモデルで多数の項目を抽出できる手法の開発を目的に,脳卒中リスク因子のテキスト構造化に取り組んだ.提案手法は大規模言語モデルの一種であるT5を項目ごとにマルチタスク学習させた単一のNLPモデルであり,血圧などの検査値の抽出タスクと喫煙・飲酒の有無といった識別タスクの両方を解くことができる.実験では,異なるマルチタスク学習方法の効果を比較するとともに,リスク因子項目ごとの性能を評価した.抽出タスクはF1値0.8以上の実用的性能を得たが,識別タスクの性能は低いのが課題である.臨床研究DXを目指し,本手法を内蔵したテキスト構造化GUIアプリを運用しながら改善を進めている.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード