一般社団法人 日本医療情報学会

[4-F-1-01] 自然言語処理を用いたWebQAサイトからのがん患者の医療ニーズ抽出

*勘場 大1、眞鍋 雅恵1、若宮 翔子1、荒牧 英治1 (1. 奈良先端科学技術大学院大学)

Natural Language Processing, Worry Classification, Breast Cancer


【背景】病気に罹った時,何らかの悩みを抱える人は少なくないだろう.実際に,Tobyoというブログのまとめサイトには,2020年6月時点で約1,400疾患,約62,000もの闘病記やブログが収録されている.なかでも治療が長期化しがちな乳がんに関するブログは多く,約6,600件の闘病記およびブログがヒットした.また,QAサイトであるYahoo!知恵袋においても乳がんを検索すると約60,000件の質問がヒットした.これらの中には医療ニーズに関係する悩みが含まれており,解決方法を実用化することは患者にとって有益であると考えられる.しかしながら,その莫大な量のデータから人手で課題をピックアップするのには限界がある.【目的】本研究では様々な自然言語処理の技術を用いて,これらのテキストデータから悩みを抽出し分類する.【材料・方法】悩みを抽出する対象は,乳がんについてのTobyoブログやYahoo!知恵袋の質問とし,悩みの分類には静岡分類を用いる.静岡分類とはがん体験者にアンケート調査を実施し,悩みや負担をデータベース化したものである.まず (1) ブログやYahoo!知恵袋の質問のテキストデータを分散表現に変換し,次に (2) 静岡分類で分類されている実際の悩みのテキストデータを分散表現に変換し,(1)と(2)の関連性をCOS類似度で悩みを分類した.【結果】2018年1月1日から2020年6月9日の間にYahoo!知恵袋に投稿された7,524件の質問を分類した結果,最も多い分類項目は「5.2.1.2. 医師の説明と理解 (2,097件)」であった.同様に,ブログを分類した結果についても検討する. 今後,分類の精度の評価及びこの技術を用いて,変わりゆく患者の悩みを捉え,臨床へ役立てたい.