第16回データ工学と情報マネジメントに関するフォーラム

講演情報

一般発表

Track 2: ビッグデータ基盤技術・セキュリティ・プライバシ

データ基盤・性能評価

2024年2月29日(木) 13:30 〜 15:40 T2-A (オンライン(Zoom Events))

座長:杉浦 健人(名古屋大学) 
コメンテータ:小山田 昌史(NEC)

15:15 〜 15:40

[T2-A-5-05] 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用

大澤 昂太 (株式会社マイクロアド システム開発部)

広告配信業務ではインターネット上で発生する大量のWebリクエストを24時間処理する必要があります。このようなデータの処理量は一日に数TB単位になります。

大量なデータを処理するには量のデータを処理するには1台のサーバでは厳しい場合が多いので、多くの場合分散処理、クラスタ、負荷分散など複数サーバをまとめて処理させるような技術が欠かせません。

弊社では広告配信サーバ、データレイクやDWHに数百台、RDBMSのMySQL、分散ストリーミング処理を行うApache Kafka、In-memoryのKVS型データベースのRedisクラスタなどがそれぞれ数十台程度で構成しています。これらのサーバは性能劣化、同期、トランザクションなどを様々な問題を抱えていて日々対処を行っています。

今回は、大量データを処理する実務の様々なポイントについてついて説明したいと思います。