Japan Association for Medical Informatics

[4-L-1-PP16-3] 医療機器不具合用語集における定義文記載法の標準化に向けた表記パターン分析

谷川原 綾子1,3, 西本 尚樹2, 福田 晋久4, 辻 真太朗3, 谷川 琢海1,3, 小笠原 克彦3, 横井 英人2 (1.北海道科学大学保健医療学部, 2.香川大学医学部附属病院, 3.北海道大学大学院保健科学研究院, 4.北海道大学大学院保健科学院)

【背景】我々は、それぞれ独立に構築された全90の医療機器不具合用語集の精緻化に向け、同義・異義語の自動判別法の検討を行ってきた。これまで、文字列の並びから文章の類似性を評価する編集距離を用いて定義文の類似性から同義語の抽出を試みたが、定義文の定形化が行われておらず、使用する用語や文末表現のばらつきにより、編集距離にて同義・異義の十分な判別を行うことが困難であった。そこで、本研究では定義文の記述法の標準化を目指し、テキストマイニングによる定型文候補の抽出を行った。
【方法】不具合用語の全3382の定義文から句点を除去した後、重複する定義文を削除した。得られた1200の定義文について、MeCabを用いて形態素解析を行い、抽出された動詞、形容動詞、否定助動詞、サ変名詞、ナイ形容詞語幹を用いて共起ネットワークを作成した。共起ネットワークにより確認された共起語を含む文章を抽出し定型文の候補とした。
【結果・考察】全異なり語数は1627語であり、品詞ごとでは、動詞272語、形容動詞53語、否定助動詞2語、サ変名詞353語、ナイ形容詞語幹2語であった。共起ネットワークにより確認された共起語を含む文章において、最も頻度が高かった表記パターンは「性能・機能が保てず、意図した効果を得られないこと」で全体の約10%を占めた。その他、抽出されたパターンとして、「不具合が生じること」、「正常に動作しない」、「包装の表示が誤っている/読めない」等が存在した。また、約20%の定義文に「意図」、「する」、「ない」の3語を含み、語の組み合わせから「意図した(動作を)しない」「意図しない(動作を)する」、「意図した以上/よりも(動作を)する」など複数の表記パターンが存在することが明らかとなった。本研究で得られた表記パターンから定型文を作成し、定義文へ当てはめることで、同義語がより精度高く判別されると考える。