一般社団法人 日本医療情報学会

[3-H-1-CS3-4] 自然言語処理の医療応用のこれまでとこれから: 3つの開発事例をもとに

荒牧 英治 (奈良先端科学技術大学院大学)

医療現場で生成される多様なデータの相当な部分は自然言語文を含んでおり,今後もそれはただちに変わりそうにない.これまで医療データの二次利用は,健診データやDPCの診療報酬データなど,比較的構造化されたデータが主な材料であったが,最近では,より大規模かつ非構造化されたデータを扱う方向へ発展しつつある.その非構造化されたデータの代表が自然言語データである.我々は,この医療分野における自然言語データの利活用を以下の3つ動向に分類している.
まず,大きな動向は,診療録(電子カルテ)に代表される医師が日常診療で残すデータの利活用を目指す方向である.本発表では,我々が退院サマリからの副作用シグナルの自動抽出を紹介する.
もう一つの大きな動向は,論文やウェブ情報など公開されているデータを残す方法である.現在,医療人工知能の多くはこの動向に位置づけられる.本発表では,症例報告を用いた診断支援システムを紹介する.
最後に,この数年ほどの間に注目を集めているのが,患者がソーシャルメディアや患者会などを通じてやり取りするプライベートなデータを扱う方向である.本発表では,ソーシャルメディアを用いた感染症サーベイランスを紹介する.
以上,本発表では3つの具体的な研究事例を用いて,それぞれの到達点,共有できるリソースを紹介し,今後の動向を議論する.