Japan Association for Medical Informatics

[4-F-2-05] 診断支援の判断根拠に応用可能な医学知識自動蓄積システムの構築

*Shoya Wada1,2, Katsuki Okada2, Shirou Manabe2, Shozo Konishi2, Toshihiro Takeda2 (1. 大阪大学大学院医学系研究科 変革的医療情報システム開発学(日本財団)寄附講座, 2. 大阪大学大学院医学系研究科 医療情報学)

Natural Language Processing, Deep Learning, Medical Knowledge

AIが疾患などを予測する医療診断支援システムの歴史は古く、様々な医療課題を対象に研究されてきた。しかしながら、これらのシステムでは知識獲得に限界があり、その更新には多大なコストを要することが課題であった。また、各システムで使用された知識データベースも自由に二次利用できる形式で公開されることはなく、医療診断支援システムは孤発的に開発されるのが実情であった。
2000年代後半から第3次AIブールが到来し、大量のデータから最適な特徴量の抽出自体を自動で学習する深層学習技術が発展した。ヒトが日常的に使う自然言語をコンピュータで処理する自然言語処理でも深層学習が導入され、ヒトと同等もしくはそれ以上の精度で特定のタスクを解くことが出来ることが示されてきた。
我々は知識データベース構築作業を深層学習による自動分類器で支援できると考え、深層学習技術を用いて医学知識を自動で蓄積するシステムの構築を目指した。本研究ではまず、疾患名とそれに起因する症状の一節が含まれる一文を自動的に認識し、データベースに追加するシステムについて検証した。
疾患名の特定には正規表現による標準病名マスタとのマッチングと、深層学習モデルによる固有表現抽出を使用した。対象疾患名とそれに対応する症状が含まれる一文かどうかを判定するモデルは、BERTモデルによる二値分類で構築した。検証にはWikipediaの疾患記事とJ-STAGEで公開されている日本語学術雑誌の疾患総説を使用した。
本データベースに蓄積された知識をさらに解析して疾患名と症状表現を構造化することが出来れば、診断支援への応用も期待出来る。
本システムを介して構築されるデータベースは誰でも利用可能な形で公開予定である。対象疾患と関連する検査の一節が含まれる文も同様の手法で取得出来る見込みであり、将来的には、検査まで取得対象を拡張させる予定である。