[3-C-4-02] 様々なOHDSIツール
OHDSI, ATLAS, R, OMOP, ETL
OHDSIデータモデルによる標準化の主眼は情報交換ではなく、解析である。医療ビッグデータをOHDSIデータモデルに変換する動機は、データ解析をミスなく、迅速に、簡単に実施したい、ということにつきる。
OHDSI CDMになっているデータに対しては、もちろん自分でRやSQLを駆使してデータ処理スクリプトを書くことはできるが、CDMデータを取り扱うことを前提としたRパッケージの集合である”Health Analytics Data-to-Evicence Suite, HADES”を利用できるのが大きなメリットとなる。HADESには、CDMデータに対して、コホートやケースコントロールデザインでのデータ抽出、回帰、傾向スコアマッチングなどを実行する機能を持った関数が含まれており、またデータベースへの接続を抽象化したり、並列処理を支援する関数群もあるので、DBIなどの汎用パッケージを使うよりも少ないコードで解析を実行でき、また、解析スクリプトの再利用可能性も高まる。
また、解析の前段階として曝露やアウトカムをコードにより定義したり、層化して抽出可能な症例数を知るフィージビリティ調査のためには、OHDSIのオープンソースツールのひとつであるATLASを利用することができる。ATLASはWebインターフェースから対話的に操作するツールで、CDMになっているデータに対して、コードの組み合わせによりコホートを定義し、抽出されたコホートの記述統計や、治療パターンの分析、イベントの発生率の分析などを、スクリプトを書くことなく、対話的な操作で実施することができる。適切な定義が完成したら、それを保存しておき、解析スクリプトから再利用することも可能である。
OHDSI CDMは、標準規格としては単純かつ小規模だが、それは解析を助けるソフトウェア実装を動かすことを主目的にしているためといえよう。