診療情報によるPhenotypingの現状・限界

河添 悦昌

[2-F-2-PS3-2] 診療情報によるPhenotypingの現状・限界

河添悦昌¹, 香川璃奈², 今井健³, 大江和彦² (1.東京大学医学部附属病院企画情報運営部, 2.東京大学大学院医学系研究科医療情報学分野, 3.東京大学大学院医学系研究科疾患生命工学センター)

診療の場で得られる表現型を効率よく収集するための情報源として電子カルテが注目されており、これに含まれる診療情報から計算機処理によって表現型を同定するタスクをe-Phenotypingと呼んでいる。ここで対象とする表現型は主に疾患であり、その重要な情報源は登録病名であるが、これは保険請求を目的とすることから真の疾患を反映しておらず、また、DPCで登録される資源最投入病名も入院患者にしか登録されないという制限がある。そのため、病名や処方歴、検査値歴、診療録など複数種類の診療情報を組み合わせ、これらに含まれる幾つかの項目を変数として目的の疾患を有する症例を選択するアルゴリズムが必要となる。筆者らのグループはいくつかのe-Phenotypingアルゴリズムを開発し精度の評価を行ったが、その過程において、判断に必要な情報がそもそも記載されていない場合が多いことや、評価のための正解ラベルの定義の仕方によりアルゴリズムの精度が大きく変わるため、アルゴリズムそのものよりも、質の高い正解ラベルを付与するための方法論がむしろ重要であるという認識に至った。これに加え、現在のe-Phenotypingは異なる目的で記録された複数の断片的な診療情報から、なんとか目的のPhenotypeを取り出そうとしているに過ぎず、これを診療行為と比較すると、生命の設計図であるゲノムの異常が疾患の本態である場合に、症状・所見・血液検査などから疾患を類推しているのと似た状況のように見える。これを変えるためには、まずPhenotypeの根幹をなす情報モデルを規定した上で、それに基づき電子カルテのテンプレートが展開され、必要情報が簡易に入力されるような仕組みを導入し、表現型を明示的に登録する必要があると考えている。

The 37th Joint Conference on Medical Informatics

[2-F-2-PS3-2] 診療情報によるPhenotypingの現状・限界