[2-G-3-03] NDB オープンデータ解析による地域医療の実態解明
Data-Driven Science, Big Data, Community Medicine
【目的】 本邦の医療ビッグデータの一環として、2009年度よりすべての電子レセプトが匿名化電子レセプトアーカイブ:National Database (NDB)として集積されている。更にNDBデータから汎用性の高い基礎的な集計表が作成され、NDBオープンデータとして公表されている。本報告では、NDBオープンデータを基に機械学習を用いて、本邦の医療提供状況の要約を試みる。 【方法】 1.研究デザイン・データ収集 厚生労働省: NDBオープンデータで公表されているレセプト情報(医科診療行為)で公表されている2014年と2017年のデータを基に行われた、後ろ向き観察研究である。 2.データハンドリング 1.「医科診療行為」を、「分類名称」単位の請求数に纏め、各県の診療行為の請求件数は分類名称単位で合計された。 2014年の分類名称は1972個であった。2017年の分類名称は2006個であった。 2. 全体の0.05%以下の請求数の少ない「分類名称」を除外し、2014年118個・2017年119個が標準化された。 3. 上記データを基に機械学習k-means++法とウォード法の2種類の異なるクラスター分析を実施し、クラスター単位で医療の特徴を検討した 【結果】 クラスターは2014年・2017年共に類似し、概ね地方ごとに、1.東京・大阪・愛知を含む、大都市圏クラスター、2.九州地方に山口・高知と徳島(2014年時のみ)が含まれる、九州を中心としたクラスター、3.沖縄のみが含まれるクラスター、4.東北地方に新潟・長野が含まれる東北を中心としたクラスター(2017年には北海道が含まれた)、5.北陸地方・瀬戸内地方を中心として京都・和歌山が含まれるクラスター(2014年時には北海道・滋賀県が含まれた)として纏められるように見えた。