[3-G-2-06] HISデータを用いたデータドリブン型バイオデジタルツインの検討
Bio-Digital Twin, Data-driven Bio-Digital Twin, Large Language Models, Hospital Information System
【目的】患者に対して何らかの医学的な介入に対する応答について、計算機上でシミュレーションするバイオデジタルツイン(BDT)が期待されている。BDTとは、一般的にはヒトなどの生物学的な仕組みやプロセスなどを計算機上で模倣することで、これらの応答をシミュレーションするものである。しかし、全ての生物学的な仕組みやプロセスを計算機上に記述することは困難であり、現在も多くの研究が進められている。一方で、病院には多くの診療データが蓄積されており、これらのデータは医学的な介入に対する患者の応答の知識の集積であると言える。そのため、これらのデータを用いることで、データドリブン型のBDTが構築できる可能性がある。よって本研究では、大規模言語モデル(LLM)を用いて診療データを学習させ、実際の患者への医学的な介入に対して、正確な応答が出来るのかを検証する。【方法】入院データにおける病名などの患者プロフィールのデータ、および処方オーダーと注射オーダー、および検体検査結果を日付別に取得し、8Bパラメータ程度のLLMをファインチューニングした。その上でテストデータの検体検査結果の予測値と実際の検体検査結果の値の比較を行った。【結果】処方および注射オーダーに対する検体検査結果の値は、例えば、ある患者のHb、Ht、MCHの値は、実際にはそれぞれ10.2, 29.7, 29.6であったのに対して11.4, 33.5, 29.4など、ある程度正確に予測できていた。また、ある患者の処方、注射を変更した場合は、これに関係する検査結果の変化が見られた。【考察】LLMによるファインチューニングによって、処方や注射、過去の検体検査結果に対する検体検査結果をある程度正確に予測できる可能性が示唆された。これに対して、処置や手術などのより多くの介入データを学習させることで、より正確な患者の応答が得られる可能性がある。【倫理的配慮】本研究は、大阪警察病院倫理委員会の承認を得て実施した(承認番号1817号)。
