Japan Association for Medical Informatics

[3-F-2-02] 医療記録に含まれる合成語の分析と用語辞書作成支援ツールの作成

*Kaoru Sagara1 (1. 奈良先端科学技術大学院大学 先端科学技術研究科)

Glossary, Thesaurus, Medical terminology, Semantic classification, application software

【目的】 
 医療記録には、「胃管挿入未」「ラシックス持続静注」「輸液継続」など、辞書に立項されていない合成語が含まれ、これらには、部署や職種によって解釈が異なる語や、複数の意味を持つ語がある。また、合成語を構成する語構成要素の語順を換えても意味の変わらない「境界型糖尿病」「糖尿病境界型」や、意味の異なる「腎嚢胞」「嚢胞腎」などもある。しかし、門外不出の医療記録に含まれる合成語の実態は明らかではない。施設内で使われる合成語と、これらを構成する語構成要素と意味を、施設内で共有できれば、コミュニケーションエラーの予防につながる。そこで、施設内で使われる合成語と、その語構成要素と意味を収録した用語集、そして、自然言語処理に役立つ機械可読の用語辞書の作成支援を本研究の目的とする。
【方法・結果・考察・結論該当部分】
 まず、医療記録で使われる合成語について知るために、公開中の分かち書き用辞書ComeJisyoの見出し語から医療記録に出現する複合名詞7,087語と、助詞などが省略された医療縮約表現810語を選定し、語構造の解析を行い、語構成要素6,633要素および1,342要素を抽出し、これらに医療の観点から有意味な意味ラベル41種と50種を付与し、「実践医療用語_語構成要素試案表」および「医療縮約表現_語構成要素試案表」を作成した。次に、施設内で、医療従事者がパソコンを使って、個人情報を含み門外不出の医療記録から合成語を抽出し、用語集および機械可読辞書を作成するための言語処理支援ツールを作成した。本発表では、医療記録に含まれる合成語と、これらを構成する語構成要素と意味分類、そして、合成語から語構成要素を抽出するためのMLMA(複層化形態素解析)記法について述べ、最後に用語辞書作成支援ツールの機能・利用法について述べる。
【倫理的配慮】
 本研究で扱う合成語は、公開中のComeJisyoの見出し語より抽出しており、倫理的配慮を要するデータは扱っていない。