一般社団法人 日本医療情報学会

[3-I-2-06] がん医療専門病院における診療記録等の非構造化データの中に含まれるがん薬物療法の有効性・安全性に関する記載の実態把握

*中島 典昭1、向井 まさみ1、安達 宏紀2、結城 美保2、岡田 法大2、杉谷 康雄2、三原 直樹1 (1. 国立がん研究センター中央病院医療情報部, 2. 中外製薬株式会社バイオメトリクス部)

Real World Data, Morphological Analysis, Cancer Drug Therapy

【背景・目的】診療記録にがん薬物療法の有効性・安全性に関する情報は記載されているが、多くは自然文で記載されるなど非構造化データ形式のため即座に解析に用いることが容易ではない。本研究は、この記載の実態を明らかにするために、非構造化データから関連する情報を抽出するアルゴリズムを開発することを目的とする。今回は、まず、対象となる診療データ記載における構成や特性の傾向を整理したので報告する。
【方法】2011年から2018年までに当院を受診し、肺がんのステージIVと診断された患者のプログレスノートを対象とした。対象から形態素解析により名詞を抽出し、増悪や副作用等に関連するキーワードの傾向を確認した。 【結果】解析対象人数は771人、抽出した診療記録は150,554レコードであった。職種別の記載数は、医師(45%)、看護師(45%)、放射線技師(3%)、薬剤師(3%)となった。記録種別ごとの頻出単語は、Problemが”CT”、”mg”、”転移”、経過記録SOAPのSは”痛み”、”大丈夫”、Oは”GRADE”、”PS”、Aは”mg”、”転移”、Pは”実施”、”服用”となった。また、Painを想起する用語として、医師は”痛み”はSubjectiveに記載し、”疼痛”はAssessmentに多く記載する傾向にあった。
【考察】今回対象とした診療記録は主に患者の診療、ケアに関するもののため記載者が医師と看護師に偏ること、対象疾患が肺がんであることから関連する検査名、副作用の判断である”Grade”等の用語が頻出することは実際の診療現場と矛盾しない。また今回新たに、記載場所によって使われる用語が異なることがわかった。
【結語】記載の傾向をつかむことで、がん薬物療法の有効性・安全性に関する情報を把握するための処理要件を把握できた。今後は特定の事象に着目した場合の検討を進める。