Japan Association for Medical Informatics

[3-E-1-02] 自然言語処理を用いた患者ブログからの手足症候群発症ユーザー抽出手法の構築

*Satoshi Nishioka1, Tomomi Watanabe1, Masaki Asano1, Kazuyoshi Kawakami2, Shuntaro Yada3, Eiji Aramaki3, Hiroshi Yajima4, Hayato Kizaki1, Satoko Hori1 (1. 慶應義塾大学薬学部, 2. がん研有明病院, 3. 奈良先端科学技術大学院大学, 4. (株)メディエイド)

deep-learning, BERT, hand-foot syndrome, adverse drug reaction, internet patient community

【目的】手足症候群は抗がん薬の中止につながりうる副作用であり、自覚症状が主な発症シグナルとなる。患者は生活に来した支障をブログとして記録・発信することがあり、そこには診療時には表面化しない副作用のシグナルが含まれる可能性がある。本研究では、患者ブログを用いて、手足症候群疑いのあるユーザーを抽出する手法を構築することを目的とした。
【材料・手法】患者闘病記サイトLife Palette におけるがん患者のブログ10,646記事を対象とした。前処理を行い、手足部位情報を含む文を取得した後、研究者3名(内1名のがん専門薬剤師含む)によりアノテーションを行い、手足症候群の教師データ(Positive文)を取得した。データは訓練用:テスト用=4:1に分け、訓練用データを用いて3つの機械学習モデル(LSTM、双方向LSTM、BERT)で学習を行い、手足症候群ユーザーの抽出器を構築した。その後、テスト用データで抽出器の性能を評価した。
【結果】手足部位情報を含む文を5,492件、さらにアノテーションにより手足症候群のPositive文を149件取得した。訓練用データによる学習後、テスト用データで抽出器の性能を評価したところ、BERTにおいて手足症候群ユーザーの抽出タスクのPrecision、Recall、F値は、それぞれ0.63、0.82、0.66であった。
【考察】手足症候群Positiveのユーザーは、関連文を複数件投稿する傾向があるため、いずれかのPositive文を拾うことにより、ユーザーの特定・抽出が可能になったと考える。今後、患者ブログで手足症候群疑いと判定されたユーザーに“気づき”を与えられれば、受診勧奨やセルフケア情報の提供を通して重症化予防に寄与できる可能性がある。