[1-H-2-03] 汎用BIツールの事例紹介と、それに適したデータモデルの提言
データ数の大きい医療データを分析する際には、平均・中央値といった代表的な統計値をチェックするのみならず、その分布の形状の観察も重要である。分布の観察にはヒストグラムが良く使われるが、この形状に偏りや外れ値などの違和感を感じた場合、その中に、入力データの品質問題など、何かの要因が隠れている場合が多い。 また、施設ごと、診療科ごと、月ごとなどの様々なカテゴリーで分けて、グラフによって比較するという層別化分析も、医療では重要な手法となる。こうした分析は、従来SQLでデータを抽出し、Excelで描画する方法が多かったが、手間もかかる上に、簡単に試行錯誤や分析軸の切替が出来ない。 BIツールを用いると、こうしたグラフによる分布のチェックや層別化分析が、短時間の簡単な操作で高速に描画可能である。SQL不要の製品も増えている。また現在、AI技法が注目されているが、最新のAIと言えども入力データ品質が悪ければ出力も低品質になるので、AIの燃料として取り込むデータの品質向上のためにもBIツールは有益である。 こうしたアプリケーションを活用する場合、医療機関で行う分析自体は、どこも大きく異なるものではないので、共通の分析テンプレートを開発し、それを使いまわすことで分析に掛かる工数、コストが大幅に低減されることが期待できる。そうして節約した工数は、根本的な原因の分析や予測など、もっと創造的な部分に費やすことができる。 共通テンプレートの開発を阻むのは、各医療機関でまちまちのDB、DWH構造である。ここからのデータ加工は、各施設独自の開発となるため多大なコストが発生している。もし標準化されたDWHに集約出来れば、分析コストが著しく低減でき、またノウハウの共有による教育コストの低減、共通の議論の枠組みの生成による創造的な研究に繋がると期待できる。医療アプリケーションベンダーに取っても、データモデルの標準化は大きな願いである。