[2-E-1-05] トピックモデルを用いた病院機能の分析手法の提案
Hospital Function, Topic Model, Latent Dirichlet Allocation, Natural Language Processing, Healthcare Professions
医療機関が有する医療機能は,医療政策や病院経営が動機付けとなり,往々にして保険点数に誘導されて形成されていく。しかしながら,病院機能には必ずしも明確な定義はなく,あるべき機能が実現されているか否かを客観的に評価する手法は確立されていない。本研究は,入手可能な公表データを用いて病院機能を分析する手法を提案し,実態の把握と可視化を目的とする。
テキストマイニング分野で利用されるトピックモデルにおいて,文書を病院に,文書中に現れる単語とその頻度を病院で働く職員とその人数に置き換えて,医療機関に潜む隠れたトピックを推定した。分析対象データとしてH29年度病床機能報告データを用いた。解析に当たってトピック数は20とし,各トピックに含まれる職員の割合と病院ごとのトピック含有率を求めた。さらに得られたトピック含有率を用いてk平均法によって病院を20のクラスターに分類した。
抽出されたトピックを見ると,いずれのトピックもそのトピックを特徴づけるいくつかの職種によって構成されていた。また,病院のトピック含有率を見ると,クラスターごとに特徴的に表れるトピックが見られた。たとえば常勤の病棟医師が支配的なトピックを多く含むクラスターには特定機能病院の承認を受けた病院が他に比べて多く現われ,平均病床数も600床以上と大規模病院が多かった。
ドナベディアンは構造,過程,結果の3つの側面から医療の質を評価できるとした。職種ごとの医療従事者の数を構造の指標の一つと考えるなら,本手法で得られたトピックは医療機関が提供する医療の質,ひいては病院機能を表していると見ることができる。本研究は,テキストマイニングで培われた手法によって病院機能を明らかにできることを示唆するものである。
テキストマイニング分野で利用されるトピックモデルにおいて,文書を病院に,文書中に現れる単語とその頻度を病院で働く職員とその人数に置き換えて,医療機関に潜む隠れたトピックを推定した。分析対象データとしてH29年度病床機能報告データを用いた。解析に当たってトピック数は20とし,各トピックに含まれる職員の割合と病院ごとのトピック含有率を求めた。さらに得られたトピック含有率を用いてk平均法によって病院を20のクラスターに分類した。
抽出されたトピックを見ると,いずれのトピックもそのトピックを特徴づけるいくつかの職種によって構成されていた。また,病院のトピック含有率を見ると,クラスターごとに特徴的に表れるトピックが見られた。たとえば常勤の病棟医師が支配的なトピックを多く含むクラスターには特定機能病院の承認を受けた病院が他に比べて多く現われ,平均病床数も600床以上と大規模病院が多かった。
ドナベディアンは構造,過程,結果の3つの側面から医療の質を評価できるとした。職種ごとの医療従事者の数を構造の指標の一つと考えるなら,本手法で得られたトピックは医療機関が提供する医療の質,ひいては病院機能を表していると見ることができる。本研究は,テキストマイニングで培われた手法によって病院機能を明らかにできることを示唆するものである。