Japan Association for Medical Informatics

[3-H-1-CS3-3] 医療テキスト解析の理想と現実

鈴木 隆弘1, 土井 俊祐2, 木村 隆1, 島井 健一郎1 (1.千葉大学医学部附属病院企画情報部, 2.東京大学医学部附属病院 企画情報運営部)

千葉大学医学部附属病院では1978年より統一された形式で退院時サマリーを作成してきました。このサマリーは手書きの複写式で自由文と選択項目から成り、カルテへの添付と代行入力によるデータベース登録が行われ、病院情報システムからの検索サービスを提供していました。2000年にはユーザーの直接入力によるサマリーの全文電子化を行いました。これが当院で医療テキストを構造的に格納した最初のシステムです。2003年には電子カルテの導入が始まり、医療テキストが大量に蓄積され始めました。
これらの蓄積されたテキストを利用して、隠れた知識を発見しようとする試みは当初から構想していて、2003年には14疾患の退院時サマリーを抽出して自動的に疾患を判定する試みを行い、良い成績を得ました。このときテキストマイニング方法として用いたのがベクトル空間モデルで、重み付けにはシンプルなTF*IDF法を採用しました。以来、カルテ記載の本文や看護記録を対象に加え、診断やDPC分類の自動判定などの試みを行ってきました。これらの成果は内科学会の類似症例検索システムとして実用化されています。現在は多施設と共同でサマリーを比較検討し、医療用語辞書の作成にも協力しています。
我々はこれまで、テキスト処理に高度な文法的解析は行っていません。大きな理由の一つは対象となるテキストそのものが文法を無視して書かれていることです。多忙な日常の臨床現場では入力に追われて文章を推敲する余裕が無いためか、カルテの記載は略語と誤変換で溢れています。
カルテは医療のアカウンタビリティの基本となるものですから、忙しいからといっていつまでも低品質のままでは許されません。診療情報管理士と協力して文章の改善に努めていますが、今後はシステムの機能としても良質のカルテ記載をサポートするための技術開発が強く求められ、それが解析精度の向上にも繋がると考えています。