Japan Association for Medical Informatics

[3-D-3-01] 医薬品情報データベースを利用した機械学習による医薬品の化学構造からの薬効推測に関する研究

*Juko Shimizu1, Tadamasa Takemura1, Takashi Nakai1 (1. 兵庫県立大学大学院応用情報科学研究科)

pharmaceutical products, machine learning, drug information database


<背景>現代の製薬は人ゲノムが解析されターゲットをゲノム情報から導き出すゲノム創薬を迎え、医薬品に対するニーズも多様になりつつある。その結果、前臨床から医薬品として承認されるまでの成功確率は約0.004%となっており、開発にかかる期間は約10 年、1新薬の上市に必要な開発コストは約1,414億円(2017年)となっている。そのため、効率的な医薬品開発が期待されている。特に、製造する医薬品について、事前に薬効を把握することができれば、医薬品開発を低コストで行える可能性がある。
 医薬品の開発は化合物の性質を決定する化学構造を修飾することにより開発されており、化合物と薬効には何らかの関係があると考えられる。一方、現在様々な組織から医薬品データベースが構築されており、その多くは医薬品の薬効、副作用や化学構造等のデータが取得可能である。よって、本研究では「医薬品データベース」および機械学習を利用することで、薬効推測が可能かどうかを検証することとした。
<目的>医薬品に関するデータベースを用いて、既知の化合物と薬効の組み合わせについて、機械学習を用いることで医薬品と候補となりうる未知の化合物に対して、その化合物の薬効を推測可能かどうかを検証した。
<方法>医薬品データベースKEGG MEDICUSから医薬品、薬効、化合物のデータを抽出した。これらのデータより、目的変数を薬効, 説明変数を化合物とし、サポートベクターマシン(SVM)を用いて教師あり機械学習を行い、検証を行った。
<結果>化合物の情報より薬効が予測可能な医薬品が認められた。一方で、化合物の種類の多さに対して医薬品を構成する化合物としてほとんど利用されていないものも存在し、そのため学習ができず予測に利用できないものなどがあった。