[2-F-5-03] 胸部CTレポートに対する肺癌患者の臨床的TNM分類を自動的に行う自然言語処理を用いたシステムの開発
natural language processing, lung cancer, TNM
【目的】自然言語処理によって肺癌患者の臨床的TNM分類 (cTNM)を自動的に行うシステムの開発【方法】初期段階として胸部CTレポートを用い、原発腫瘍の進展度を示すT分類の自動分類システムを開発した。大阪大学医学部附属病院で、肺がんと診断され、癌登録された患者のうち、cT分類を明確に付けられる2019年1月から2019年12月までに検査された124例の胸部CTレポートをtraining set、同じく2020年1月から2020年12月の118例をtest setとした。アノテーションは肺癌取扱い規約第8版に倣い、筆頭著者が行った。自然言語処理としては、過去に著者らが開発した、胸腹部に関する文書を深層学習によって固有表現と関係抽出を行うシステムをベースとして、充実径や浸潤、副腫瘍結節や閉塞性肺炎、無気肺等のcT分類の判定に必要な情報をルールベースで構造化するアルゴリズムとT分類を行うためのアルゴリズムを新規に組合せた。【結果・考察】cT分類の予測として、training set、test set其々で、Accuracyは83.9%、66.1%であった。Training setにおいては、副腫瘍結節や無気肺・閉塞性肺炎の抽出などの複雑な文書の関係抽出を要因として誤分類が生じていたが、test setでは充実径や原発巣の抽出に関する誤りが多く、ルールの汎化性の課題が明らかになった。また、training set、test setに共通した誤分類の要因として、原発巣が明示されていない等、レポートの記載内容が不十分であったことがあげられた。これらは研究のリミテーションであるものの、レポートの記載を標準化すること、あるいは人の目で見るべきレポートを選別できることが対応策と考えられる。【倫理的配慮】本研究は大阪大学医学部附属病院倫理審査委員会の承認の元、実施している。
