[II-15-32] 家畜由来のRNA-Seqの実施と現状、問題点
次世代シークエンス技術の開発速度は凄まじく、2021年に化石からマンモスのゲノム情報の80%が解明される時代となった。一方、いわゆるRNAの全てのmRNAの配列を次世代シークエンサーにより解読し、リファレンスゲノムへマッピング、定量的に遺伝子発現を検出するRNA-Seq技術が一般化している。RNA-Seq技術は従来のマイロアレイ法と比較して再現性に優れるが、実際に運用するにあたり様々な技術的な問題が発生している。本発表では実際にRNA-Seqを運用してみたいが、どれほどのリード数を確保すれば良いのか、また解析に当たりどのような技術が必要となるのか議論する。実際に我々がRNA-Seqを開始するに当たって直面した技術的問題、解析に必要とされるハードウェアの構成を紹介する。さらに解析に当たってどのようなアルゴリズムが必要となるか、最新の状況を考察する。具体的には、データ処理の初期段階ではLinuxによるデータ処理が必要であり、データの可視化に当たってはR言語を使用する必要に迫られる。さらに目的のサンプルの間で異なる遺伝子発現する遺伝子群を抽出するためには、統計学的な処理と遺伝子発現の正規化が必須でありこれらの適切な処理なしには目的とする遺伝子群を抽出することは困難である。これらの操作をイルミナ社の解析ソフトと比較し、ユーザーの視点から長所および短所が存在する。