[2-G-1-OP5-4] 検査表現と潜在的解釈の相互変換方法とその評価法の設計
【背景】ビッグデータ化した医療テキストの二次利用に注目が集まっているが,これまでの多くの研究は名詞,または複合名詞として表現された病名や症状の抽出に留まっていた.しかしながら,複合名詞の範囲を超えた病気や症状の表現も一定量存在し, 医療言語処理にとって大きな課題となっている.
【目的】本研究では,名詞でない症状表現のうち,検査表現(検査名と検査値のペア)を 疾患を意味する言語表現へ変換することを目指す.
【手法】まず,日本内科学会にて2002年から2015年に報告された約4万5千件の症例報告の本文から検査名,検査値,言語による解釈という3つの要素が共起する文を自動抽出する.これは,検査名の後続の3文字以内から始まる数字列を検査値とし,検査値の後続の25字の中で一番初めに登場した疾患名・症状名を解釈とみなすことで行う.例えば,「CRP12.0と強い炎症が見られ」においては,(CRP,12.0, 強い炎症)が(検査名,検査値,言語表現)となる.最後に得られた検査名,検査値,言語表現セットを統計的に処理し,検査名ごとに言語表現のとりうる検査値をモデル化した.
【実験】 抽出された言語表現が検査値のガイドラインに記載されているもの(「異常」や「高値」など)は,ガイドラインを参考に評価を行った.また,主観的な表現の場合(「炎症」など)は,数値から言語表現への変換可能性が一意に定まらないことが多く困難である.そこで,医療従事者が,言語表現から逆に検査値を推定する手法で妥当性を検証した.
【結果・考察】検査値の中でも頻出するHbA1cとCRPについて検証を行った.この結果,ほぼガイドラインや医療者の常識の範囲に収まる値を得た.本研究により,検査表現を,疾患を意味する言語表現に変換できる可能性だけでなく,その逆変換もできる可能性も示唆された.
【目的】本研究では,名詞でない症状表現のうち,検査表現(検査名と検査値のペア)を 疾患を意味する言語表現へ変換することを目指す.
【手法】まず,日本内科学会にて2002年から2015年に報告された約4万5千件の症例報告の本文から検査名,検査値,言語による解釈という3つの要素が共起する文を自動抽出する.これは,検査名の後続の3文字以内から始まる数字列を検査値とし,検査値の後続の25字の中で一番初めに登場した疾患名・症状名を解釈とみなすことで行う.例えば,「CRP12.0と強い炎症が見られ」においては,(CRP,12.0, 強い炎症)が(検査名,検査値,言語表現)となる.最後に得られた検査名,検査値,言語表現セットを統計的に処理し,検査名ごとに言語表現のとりうる検査値をモデル化した.
【実験】 抽出された言語表現が検査値のガイドラインに記載されているもの(「異常」や「高値」など)は,ガイドラインを参考に評価を行った.また,主観的な表現の場合(「炎症」など)は,数値から言語表現への変換可能性が一意に定まらないことが多く困難である.そこで,医療従事者が,言語表現から逆に検査値を推定する手法で妥当性を検証した.
【結果・考察】検査値の中でも頻出するHbA1cとCRPについて検証を行った.この結果,ほぼガイドラインや医療者の常識の範囲に収まる値を得た.本研究により,検査表現を,疾患を意味する言語表現に変換できる可能性だけでなく,その逆変換もできる可能性も示唆された.