[3-B-2-02] 時系列クラスタリングを用いたクリニカルパスの自動作成
Clinical Pathway, Data Mining, Clustering, Machine Learning
【はじめに】クリニカルパス(パス)システムの新規導入時等において、パスマスタ作成が業務逼迫の一因となっている。そこで、パス自動作成システムによって業務負担軽減を目指し、株式会社ソフトウェア・サービスと国立病院機構四国がんセンターの共同で研究開発に取り組んでいる。本研究においては、対象症例の実施タスクデータに対して時系列クラスタリングを行い、パスの雛形となり得る標準タスクを選抜した。
【方法】①DPCコード14桁中の傷病名(1-6桁)と手術(9・10桁)を指定し、A)症例、B)実施タスク(注射、検査、看護指示)を取得。
②Aの在院日数に対して、四分位範囲法により外れ値を除外。
③②に関連するBに対して、One-Hotエンコーディングでベクトル化し、主成分分析により次元圧縮。
④③で得たベクトルに対して、動的時間伸縮法による距離に基づく時系列クラスタリングを実施。
⑤クラスタの中心近傍付近における上位症例で実施タスクの集計を取り、過半数を標準タスクとして選抜。
【結果】既にパスが作成・運用されている胃切除の症例に対して本手法を用いたところ、各症例に適用されているパス改訂前後の2つの版に対応する2つのクラスタに完全分離できた。選抜した標準タスクとパスのタスクとの一致度の指標であるJaccard係数は0.809であった。
パス未作成の甲状腺全摘においては、DPCの甲状腺切除に該当する症例に対して本手法を用いたところ、甲状腺全摘のクラスタが概ね分離でき、その標準タスクを選抜した。
同じくパス未作成の大腸ポリペクトミーでは、主に「病理組織標本作製」の1臓器と2臓器に対応する2つのクラスタに概ね分離できた。
【おわりに】時系列クラスタリングによって、時系列タスクに内在するクラスタ構造を見つけ出すことが可能であった。標準タスクの選抜方法は課題である。システム化する際には利用者が閾値を選択できるようにしたい。
【方法】①DPCコード14桁中の傷病名(1-6桁)と手術(9・10桁)を指定し、A)症例、B)実施タスク(注射、検査、看護指示)を取得。
②Aの在院日数に対して、四分位範囲法により外れ値を除外。
③②に関連するBに対して、One-Hotエンコーディングでベクトル化し、主成分分析により次元圧縮。
④③で得たベクトルに対して、動的時間伸縮法による距離に基づく時系列クラスタリングを実施。
⑤クラスタの中心近傍付近における上位症例で実施タスクの集計を取り、過半数を標準タスクとして選抜。
【結果】既にパスが作成・運用されている胃切除の症例に対して本手法を用いたところ、各症例に適用されているパス改訂前後の2つの版に対応する2つのクラスタに完全分離できた。選抜した標準タスクとパスのタスクとの一致度の指標であるJaccard係数は0.809であった。
パス未作成の甲状腺全摘においては、DPCの甲状腺切除に該当する症例に対して本手法を用いたところ、甲状腺全摘のクラスタが概ね分離でき、その標準タスクを選抜した。
同じくパス未作成の大腸ポリペクトミーでは、主に「病理組織標本作製」の1臓器と2臓器に対応する2つのクラスタに概ね分離できた。
【おわりに】時系列クラスタリングによって、時系列タスクに内在するクラスタ構造を見つけ出すことが可能であった。標準タスクの選抜方法は課題である。システム化する際には利用者が閾値を選択できるようにしたい。