一般社団法人 日本医療情報学会

[3-D-2-01] クラウドサーバとオンプレミスサーバを組み合わせたハイブリッドシステムの構築と活用

*山口 泉1、川口 喬久1、寺岡 亮1、稲富 雄一1、深沢 圭一郎3、関谷 勇司4、塙 敏博4、大川 恭行5、前原 一満5、南里 豪志6、村田 健史7、橋本 洋希1,2、松田 文彦1、山田 亮1、長﨑 正朗1,2 (1. 京都大学 大学院医学研究科 附属ゲノム医学センター, 2. 京都大学 学際融合教育研究推進センター, 3. 京都大学 学術情報メディアセンター, 4. 東京大学 情報基盤センター, 5. 九州大学 生体防御医学研究所, 6. 九州大学 情報基盤研究開発センター, 7. 情報通信研究機構 総合テストベッド研究開発推進センター)

cloud system, hybrid system, on-premise, L2 VPN, whole genome sequencing

背景:解析機器の進歩によりゲノム解析で生じるデータが膨大となり、ゲノム研究の被験者規模も増大している。当施設はオンプレミスサーバで解析を行なってきたが、機器維持の労力とコストが増大し、管理運用が年々厳しくなってきた。他方、商用クラウドサービスは近年性能や品質の向上が著しく、高い計算能力と高度なセキュリティを持つ環境を提供する。
目的:オンプレミスサーバにクラウドサービスと学内外のスーパーコンピュータサービスを組み合わせたハイブリッドシステムを構築し、活用法を探る。
方法: ①アマゾンウェブサービス(AWS)のSINET接続サービスを用い、自施設LANとAWSネットワークをSINET網で高速接続。 ②自施設ストレージとAWSストレージのAWSへの転送速度を比較。 ③解析パイプライン構築用にコンテナシステム、ジョブ管理用にバッチジョブシステムをオンプレミスとAWSに導入し、スーパーコンピュータを含む三環境で共通の処理が実行可能な体制を構築。 ④自施設で開発中の疾患関連変異検索サービスの本環境への展開方法を検討。
結果: ①SINETの専用VLANを通じて自施設とAWSをBGP対応L3スイッチ(10Gbps)で接続した(L2 VPN)。 ②自施設ストレージ(IBM GPFS)からAWSへの転送速度はAWSストレージ(S3)の転送速度の約2.5倍であった。 ③コンテナにSingularity、ジョブ管理にSlurmを採用し、状況によりサーバを使い分ける体制とした。 ④外部の専門家とAWSで開発後、ElasticSearchによる検索をオンプレミスサーバが、WebサービスをAWSサーバが担当してSINET経由で連携する構成とした。
考察:
当施設ではオンプレミスサーバや大学提供の仮想サーバを使用してきたが、今回の仕組みでより柔軟な運用が可能となった。クラウドサービスは従量課金のため費用を見ながら利用範囲を拡げる。