[3-C-1-04] 診療記録からの疼痛に関する事実性判定
Natural Language Processing, Medical Informatics, Pain
【背景】医療において、疼痛のマネジメントや医療者間での情報共有は重要である。発生した疼痛とその性状が構造化情報として入力されれば、疼痛ケアの質の評価や介入を要する症例の抽出等に役立つと考えられるが、その多くはフリーテキストとして記載されることが多いため、その利用が課題となる。
【目的】自然言語処理技術を用いることで、診療記録に疼痛の情報が含まれているかを識別するための手法を検討する。また、識別に必要な学習データのアノテーション方法についての検討も同時に行う。
【方法】東京大学医学部附属病院の診療・看護記録からランダムに約1,000件を抽出し、対象として使用した。対象記録にはさまざまな表現で疼痛に関する症状が記載されるため、大量に存在する記録から候補となる記録を絞り込むために分散表現を用いた。そして識別では、対象記録に疼痛の記載があるのかないのかといった2値分類だけでなく、疼痛が現在発生しているのか、過去に発生したのか、発生が否定されているのか、潜在的に起こりえるイベントとして記載されているのかという詳細な5クラスの事実性判定を行った。
【結果】病名などを事前学習した固有表現抽出器を用いて、特徴量として用いた時のマクロF値が0.49と最も高かった。
【考察・まとめ】本研究では文書単位でアノテーション作業と識別実験を行ったが、1つの記録から複数のラベルが推測されるような場合は識別が困難であることが分かった。また、クラスの細分化を行ったことで、アノテーション作業の難易度が上がり、アノテーションにばらつきが発生することが確認された。そのためこれらについて今後の更なる検討が必要であると考えられる。
【目的】自然言語処理技術を用いることで、診療記録に疼痛の情報が含まれているかを識別するための手法を検討する。また、識別に必要な学習データのアノテーション方法についての検討も同時に行う。
【方法】東京大学医学部附属病院の診療・看護記録からランダムに約1,000件を抽出し、対象として使用した。対象記録にはさまざまな表現で疼痛に関する症状が記載されるため、大量に存在する記録から候補となる記録を絞り込むために分散表現を用いた。そして識別では、対象記録に疼痛の記載があるのかないのかといった2値分類だけでなく、疼痛が現在発生しているのか、過去に発生したのか、発生が否定されているのか、潜在的に起こりえるイベントとして記載されているのかという詳細な5クラスの事実性判定を行った。
【結果】病名などを事前学習した固有表現抽出器を用いて、特徴量として用いた時のマクロF値が0.49と最も高かった。
【考察・まとめ】本研究では文書単位でアノテーション作業と識別実験を行ったが、1つの記録から複数のラベルが推測されるような場合は識別が困難であることが分かった。また、クラスの細分化を行ったことで、アノテーション作業の難易度が上がり、アノテーションにばらつきが発生することが確認された。そのためこれらについて今後の更なる検討が必要であると考えられる。