Japan Association for Medical Informatics

[2-I-3-1] 過去の臨床研究を用いた汎用的な変数抽出モデルの開発

豊島 雄太1, 安藤 文彦1, 荒木 賢二1, 山﨑 友義1, 串間 宗夫1, 小川 泰右1, 松尾 亮輔1, 下川 忠弘2 (1.宮崎大学医学部附属病院医療情報部, 2.京都民医連中央病院)

近年、次世代医療基盤法に代表される法整備や、ナショナルデータベースの開放などにより、本邦における医療データ2次活用の推進体制が整ってきている。一方で、研究者のデータ分析を支援するデータサイエンティストの不足が問題視されている。本研究では、研究に用いる汎用的な変数の抽出モデルを作成し、データベース研究に不慣れな研究者やデータサイエンティストが簡便かつ迅速に研究用データの抽出を行うための仕組みを構築する。既存の臨床試験から複数の臨床研究概要を選択し、分析プロコトルを整理する。対象とする臨床研究は、宮崎大学附属病院において2017年に処方額上位となった薬剤を対象に、薬効別にJAPIC臨床試験概要の検索を行い抽出した。 選択した臨床試験それぞれのプロトコルにおいて必要となる項目や指定する抽出方法、条件を洗い出し、多くのプロトコルにおいて共通する項目と固有に必要となる項目に分け体系的に整理した。多くの研究で共通する項目、指定方法について汎用的変数として設定し、抽出のためのモデルを構築した。11薬効、18薬品を対象とした臨床研究概要について確認を行ったところ、分析のため必要となる情報として123属性が確認され、大項目として19種類に区分された。このうち年齢や妊娠の有無、併用薬の有無等については多くの研究で必要とされる共通項目であった。各共通項目を汎用的変数として抽出モデルを設定した。複数の研究において共通的に必要となる項目が多くあり、事前に汎用項目の抽出モデルを設定することは研究を迅速に進める上で有効である。今後、汎用的な変数抽出モデルへ組み込む項目を増やし、データベース研究を迅速に行う体制を整備していくことが重要である。一方で、研究で必要となる項目は多岐にわたり全項目をカバーすることは出来なかった。研究者を支援するデータサイエンティスト育成も並行して進めていくことも重要と考える。