2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-7 医歯薬学・生命科学の革新を目指した言語処理

[3S1-OS-7b] 医歯薬学・生命科学の革新を目指した言語処理

2024年5月30日(木) 09:00 〜 10:40 S会場 (52研修交流室)

オーガナイザ:矢田 竣太郎(奈良先端科学技術大学院大学)、荒牧 英治(奈良先端科学技術大学院大学)、河添 悦昌(東京大学)、堀 里子(慶應義塾大学)

09:40 〜 10:00

[3S1-OS-7b-03] 難病・希少疾患の症例報告を用いたコーパス作成における課題と人工知能の応用

〇土肥 栄祐1、建石 由佳2、藤原 豊史3、山本 泰智3 (1. 国立精神神経医療研究センター 神経研究所、2. 国立研究開発法人科学技術進行機構 NBDC 事業推進部 、3. 情報・システム研究機構 ライフサイエンス統合データベースセンター)

キーワード:医療情報、テキストデータ

人工知能(AI)を用いた診断支援には、正確な症例ベースのコーパスが必要であり、これには複数の課題がある。本抄録では、これらの課題とAIを活用した解決策を提案する。症例報告の共有は個人情報保護のため困難であり、PDFからのテキスト抽出や病名の表記揺れ、臨床データの構造化、テキストデータの正規化、情報の抽出とアノテーションが主な課題である。特に、PDFからのテキスト抽出は技術的に難しく、病名の表記揺れも多く見られる。臨床データの構造化にはCaseSharingのようなシステムが有効で、テキストデータの正規化は大規模言語モデル(LLM)である程度解決できた。また、LLMを用いることで、時系列に沿った情報抽出が可能だが、アノテーションは依然として課題である。これらの経験から、AIの応用はデータセット作成においても重要な役割を果たすと考えられる。今後は、これらの技術をより効果的に活用する方法について議論を深めたい。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード