10:20 〜 10:40
[4F1-GS-3-05] 表現型データの類似度に基づく疾患モデル生物推定
キーワード:バイオインフォマティクス、知識グラフ、データ統合、疾患、TF-IDF
疾患モデル生物とは、疾患を研究するために遺伝的に操作された生物や突然変異体のことを指す.これらは特定の疾患を再現するように設計されており、疾患メカニズムの解明、治療法の開発に不可欠である.これまでに我々は, 7828件の実験マウスから疾患に関連する遺伝子の情報を用いて1208種類の疾患に対応する1938件の疾患モデルマウスの候補を選抜してきた.ただしこの方法では,疾患関連遺伝子の情報を持たない疾患に対して,疾患モデルマウスを見つけることができない欠点があった.本研究では,4438件の実験マウスが示す表現型用語(例,蕁麻疹)の関係データと,疾患と表現型用語の関係データを用いて,集合類似度とTF-IDFコサイン類似度を算出,これらをRDF化,知識グラフを作成,SPARQLで検索可能にし,表現型情報を用いた疾患モデルマウスの推定を行った.その結果,203種類の疾患に対応する239件の疾患モデルマウス候補を見つけることができた(コサイン類似度 0.5以上).これらのうち,疾患189種類(例,好塩基球減少症)とそれに対応する疾患モデルマウスの候補179件は新規に発見されたものであった.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。