[2-D-1-01] 患者状態に関する網羅的なアノテーション基準とFHIR Conditionリソースとのマッピングの検討
HL7 FHIR , Condition Resource, Clinical Text, Natural Language Processing
【背景】HL7 FHIRの Conditionはカルテに自由記載される情報を多く含む。我々はこれまで、症例報告を材料として患者状態を網羅的にアノテーションする基準、すなわち固有表現タグ・属性・関係のセットを提案しコーパスを構築してきた。本基準によりアノテートされる情報とConditionの要素との対応が十分であれば、機械でアノテーションを再現することでCondition情報を抽出することが可能となる。 【目的】本基準によるアノテーションとConditionの要素との対応を検討する。 【方法】HL7リファレンスのConditionプロファイル(v4.0.1)から、情報が自由記載されると思われる要素をリストアップし、構築したコーパスにおいて対応するアノテーションを検討した。 【結果・考察】リストアップされた構成要素は14あり、categoryを除く13の要素に対応するアノテーションが存在した。以下、重要な構成要素についての検討を述べる。subjectについて、本基準では本人に生じる状態かどうかを固有表現タグの属性で区別できる。codeとbodySiteについて、本基準でも同様の固有表現タグと関係の組み合わせが対応するが、codeとbodySiteの分離が難しい場合がある。これは対応先の用語集に依存する問題であるため、固有表現を正規化しコードを付与する段階での処理が適切と考えられた。clinicalStatusについて、本基準では状態の有無を示す事実性タグに対応するが、より詳細なrecurrenceやrelapseなどに相当する情報はテキストに明記されない可能性がある。verificationStatusが取りうる値のうちいくつかは、本基準では事実性タグの疑い属性に丸められるため区別できない。本研究は症例報告を対象としたものであるため、今後、実際の診療記録を対象に検討する必要がある。