10:20 〜 10:40
[2L1-OS-25-05] LLMを用いた難病・希少疾患コーパス作成時の課題と効率化に有用なツール
キーワード:難病・希少疾患、大規模言語モデル、コーパス、オントロジー、アノテーション
難病・希少疾患は約1万に及び、症例数が少ないため医療者が経験を積み難く、診断に平均7~8年を要するとされる。この課題に対し人工知能の活用が模索され、質の高い症例コーパスの整備が求められている。我々は日本語症例報告のテキストに疾患名・症状名をタグ付けしたコーパスを作成しており、大規模言語モデル(LLM)と、アノテーションを管理・編集するウェブツールを用い効率化を進めている。LLMを用いたアノテーションでは、1)トークン数削減のためのデータ正規化、2) 処理が途切れないための、短い単位でチャンク化した入力、3) JSON形式での出力を求めるプロンプト、等の工夫をした。続けて専門家によりTexTAE(https://textae.pubannotation.org/)を用いGUIベースでの評価・修正を行い、PubAnnotation(https://pubannotation.org/)を用いアノテーター間の相違点の評価・修正を行っている。発表では、LLMを用いた症例コーパス作成におけるHuman in the loopの実装経験を紹介し、効率的なワークフローに必要な機能について議論する。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。