Japan Association for Medical Informatics

[4-A-2-01] がんの統合的解明を目指したオミックス情報の階層的ネットワークに対する機械学習・深層学習技術の応用

浜本 隆二1 (1. 国立がん研究センター研究所)

21世紀に迎えたポストゲノミクスの時代において、ゲノム情報を中核として、エピゲノム、トランスクリプトームなどの大量のオミックスデータが得られるようになり、多くの分子間ネットワークが階層的に織りなす生体情報の全容が少しずつ明らかとなってきた。がんを始めとする多くの疾患はこの複雑な生命システムの破綻が起点となる。すなわち、がんの全体像を解明するためには、分子間のネットワーク構造が生み出す特性、生体情報の階層性を横断的に解析し、システムレベルでの深い理解が欠かせない。しかしながら、生命を構築する各階層の分子間ネットワークは、正負両方のフィードバックループや経路間のクロストーク、階層間相互作用などが複雑に入り組んだ本質的な複雑性を有し、そのモデリングは容易ではない。また、次世代シークエンサーの登場によって加速的にデータが蓄積されていく一方で、ノイズの増加への対応、組み合わせによる仮説の増加による相対的な検出力の低下、マルチモーダル性を扱う解析の本質的な難しさなど、統計科学上の課題が浮き彫りとなっている。すなわち、システムの理解という観点から考えると、生体情報のネットワークが生み出す特性、階層性を横断的に解析し、全体像を把握することは未だに困難な課題である。そこで、我々は機械学習・深層学習を中核技術として用いることで、がんの生体時空間にわたるシステム的統合理解への橋渡し研究を行うことを目指して研究を行ってきた。特に、多層オミックスデータに対して機械学習・深層学習を用いた発見的なアプローチを追及し、生体情報の階層的なネットワーク構造に内包される高次元空間内の相関関係を低次元に圧縮し、科学上意味のある結果を導き出すための方法論の構築を行うことに、焦点を当ててきた。本講演では、これまでの取組で得られた成果・知見を基に、機械学習・深層学習技術を用いた多層オミックス解析の可能性・課題に関して発表する。