2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-25 生成AI時代に医歯薬学・生命科学の革新を目指すAI応用

[2L1-OS-25] 生成AI時代に医歯薬学・生命科学の革新を目指すAI応用

2025年5月28日(水) 09:00 〜 10:40 L会場 (会議室1007)

オーガナイザ:矢田 竣太郎(筑波大学),荒牧 英治(奈良先端科学技術大学院大学),河添 悦昌(東京大学),堀 里子(慶應義塾大学),木﨑 速人(慶應義塾大学)

10:20 〜 10:40

[2L1-OS-25-05] LLMを用いた難病・希少疾患コーパス作成時の課題と効率化に有用なツール

〇土肥 栄祐1、金 進東2、早川 格3、松原 知康4、高月 照江2、建石 由佳5、藤原 豊史2、山本 泰智2 (1. 国立研究開発法人 国立精神神経医療研究センター、2. 情報・システム研究機構 ライフサイエンス統合データベースセンター、3. 国立成育医療研究センター 神経内科、4. 徳島大学 脳神経内科、5. 国立研究開発法人科学技術進行機構 NBDC 事業推進室)

キーワード:難病・希少疾患、大規模言語モデル、コーパス、オントロジー、アノテーション

難病・希少疾患は約1万に及び、症例数が少ないため医療者が経験を積み難く、診断に平均7~8年を要するとされる。この課題に対し人工知能の活用が模索され、質の高い症例コーパスの整備が求められている。我々は日本語症例報告のテキストに疾患名・症状名をタグ付けしたコーパスを作成しており、大規模言語モデル(LLM)と、アノテーションを管理・編集するウェブツールを用い効率化を進めている。LLMを用いたアノテーションでは、1)トークン数削減のためのデータ正規化、2) 処理が途切れないための、短い単位でチャンク化した入力、3) JSON形式での出力を求めるプロンプト、等の工夫をした。続けて専門家によりTexTAE(https://textae.pubannotation.org/)を用いGUIベースでの評価・修正を行い、PubAnnotation(https://pubannotation.org/)を用いアノテーター間の相違点の評価・修正を行っている。発表では、LLMを用いた症例コーパス作成におけるHuman in the loopの実装経験を紹介し、効率的なワークフローに必要な機能について議論する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード