Japan Association for Medical Informatics

[2-G-1-OP5-1] 医療文書分析の目的限局性に基づく単語階層の構成法の検討

松尾 亮輔, Ho Tu Bao, 池田 満, 田中 孝治, 陳 巍 (北陸先端科学技術大学院大学)

電子カルテの二次利用の整備が進み,カルテ内の膨大な医療情報の利活用への期待が高まっている.診療支援のために,医療文書を用いてデータマイニングによる予測や検索などの分析がされている.文書を分析するには,文書を数値で計算可能な形式に表現する.医学文書を分析する際は,医学オントロジーを活用して,文書内の単語の概念に着目することで,類義語や同義語の同定や単語タイプの識別により,目的志向の重み付け手法が開発され,検索や分類などに用いられている.
先行研究において,医学単語集合を分析目的独立のものから依存性の高いものへと順に配置した単語階層を用いて,分析目的限局性の重み付けをすることが,分析精度の向上に有効であることを実験的に示した.特に階層の上位から順に,重み付けに用いる単語の種類を増やすと,分析目的独立の単語集合と目的依存の単語集合の境界で,分析精度の向上が認められた.よって,目的独立単語の下位に目的依存単語を配置する汎用手法を構成できることが示唆された.
本研究で構成した手法は以下である.入力は医療文書内の単語集合である.分析目的と独立する単語集合は,最上位で非医学単語集合と医学単語集合からなり,医学単語集合はICD-10医学単語集合と非ICD-10医学単語集合からなる.出力は分析に用いられる単語の階層構造である.提案手法の処理手順は,ICD-10単語が持つ複数の概念について,分析目的との関連により,様々な分析目的に依存する単語集合を構成する.さらに,単語の共起により学習される類似性に基づき,非ICD-10医学単語集合と非医学単語集合から,分析目的による単語の集まりに類似する単語集合を構成する.
医学知識基盤が充実し,機械学習技術が進展する中で,目的志向の重み付けの観点から,既存知識の組み合わせと,機械学習の活用により,新たに分析目的による階層的な単語分類体系を作ることで,医療ビックデータ分析による知識獲得支援が期待できる.