Japan Association for Medical Informatics

[4-C-3-06] 血液検査値の同時分布の可視化

Tetsu Furukawa1, Rina Kagawa2, Takahide Kohro3, *Masanori Shiro1, Shotaro Akaho1 (1. 産業技術総合研究所, 2. 筑波大学, 3. 自治医科大学)

Blood test values, Joint distribution, Lognormal distribution, Graphical lasso, Pseudo data

個人情報漏洩のリスクを抑え、誰でも自由に利用できる擬似的な生体データを整備することは、医学教育、医学研究において有用である。生体データのうち、静脈血を利用した血液検査は健康診断や疾患のスクリーニングにおいて特に広く利用される基本的な検査である。我々の目標は、こうした血液検査における擬似データの整備を行うことである。特に我々は、血液検査値のパラメトリックな分布による表現に着目したい。血液検査値に対して統計分布による表現が与えられると、表計算ソフトやスクリプト言語を利用して誰でも簡単に擬似的データを作成できるのみならず、血液検査値間の関係性がパラメータによって定量化されるため、正則化などを使った統計的手法によって異なる検査項目間の分析が可能になるといった利点がある。
そこで本研究では、筑波大学附属病院全科で得られた入院患者(2013年から2018年、20歳以上、102,830名)の血液検査値と、自治医科大学附属病院循環器内科にて得られた入院患者及び外来患者(2010年から2021年、20歳以上、25,058名)の血液検査値から、日内変動が大きなホルモンや、検定に十分な数のサンプルを得られなかった項目を除外し、100種類程度の検査値の同時分布を6パラメータの単一の分布にて近似し、表現した。本研究は筑波大学附属病院研究倫理審査委員会(R1-080)および自治医科大学臨床研究等倫理審査委員会(臨大16-変059(臨大15-096変更)号)による許諾を得て行われた。
我々が表現した分布とそのパラメータは個人情報漏洩のリスクを抑えた上で誰でも自由に無償で利用可能である。擬似的なデータの作成のみならず、統計的手法による分析の基盤として、広く利活用を促したい。