Customer Story: RB - Databricksの翻訳です。
業種: 消費財
ソリューション: 需要予測
技術的ユースケース: データ投入、ETL、機械学習
地域: イギリス、ヨーロッパ
要約:
- サポートできるビジネス規模が10倍に拡大
- 80TBのデータを2TBまで圧縮(**98%**の容量削減)しオペレーションコストを削減
- 24時間x7日稼働のジョブにおけるデータパイプラインを2倍に高速化
数百万もの顧客に消費財サービスを提供する多国籍企業であるReckitt Benckiser(RB)は、断絶された多くのパイプラインから提供される異なる種類の大量データを取り扱わなくてはならなかったため、需要予測の複雑性に苦慮していました。今では、Azure DatabricksがRBに統合データプラットフォームを提供することで、データチームはビジネスサイドに機械学習によってサポートされた洞察を提供し、予兆分析、製品配置、ビジネス予測を通じて近隣の雑貨店をサポートしています。
課題
RBは60以上の国に製品を配送していました。彼らの主要なマーケットセグメントは、伝統的な取引、近所の雑貨店と呼ばれていました。このマーケットは非常に分散しており、かつ、特にアジア、アフリカ、南米で急増している小さな個人経営のお店でした。これらの市場にサービスを提供するために彼らは、お店のオーナーがそれぞれのマーケット特有の需要に応えるベストな製品を選択するのを支援するために、それぞれの店舗を訪れる16,000人以上の担当者からなるチームを持っていました。
需要予測を改善するために彼らが持っているもっとも重要な資産の一つがデータでした。しかし、RBは断絶された多くのパイプラインから提供される異なる種類の大量データと奮闘していました。よりビジネスを活性化し、お店のオーナーたちが効率的に作業できるようにするために、データから効率的に洞察を得ることが、彼らにとっては非常に困難でした。
- 24時間x7日間稼働し続ける250以上のデータパイプラインから毎日もたらされる2TB以上のデータの処理。
- 内部のビジネスチーム(ファイナンス、セールス、オペレーション)にとっては、POSデータ、eコマースデータ、ニールセン、顧客分析結果などの外部データへのアクセス及び処理が困難だった。
- Hadoopのインフラストラクチャは、複雑、面倒、そしてスケールしにくかった。このレガシーシステムはパフォーマンス面でも課題があったことに加え、新たなデータセットをデプロイするのも難しかった。このため、DevOpsチームは常に監視を行い、問題修正を繰り返すことになり、適切なタイミングで洞察を提供することが難しかった。
ソリューション
Azure Databricksによって、データチームが迅速に改革を行い、機械学習に支えられた示唆をビジネスサイドに提供でき、かつ、データサイエンスとデータエンジニアリングチームが協働できるスケーラブルな統合データ分析環境がRBにもたらされました。
- 自動化されたクラスター管理機能を持つフルマネージドのプラットフォームにより、インフラストラクチャとオペレーションをシンプルなものにし、スケーラビリティを確保した。
- 複数の言語サポートを持つSSLノートブック環境は、様々なチームがそれぞれ必要な言語を用いつつも、円滑なコラボレーションを可能にした。
- Delta Lakeのネイティブサポートにより、データセットを圧縮することで、多大なるコスト最適化、ストレージ容量の削減を実現した。
成果
Databrikcsにより、RBは劇的なパフォーマンス改善、コスト管理の改善を実現し、彼らのビジネス拡大、迅速なる機会創出を可能にした。
- 改善されたコスト最適化: Delta Lakeを活用することで、彼らのデータを80TBから約2TBまで圧縮し、下流のデータ分析パイプラインを加速しつつも、コスト管理を改善することができた。
- インサイト提供の時間短縮: Databricksのパイプライン性能の改善により、24時間7日稼働しているジョブを二倍まで高速化した(全パイプラインの実行に24時間要していたのを13時間まで短縮)。
- マーケットシェアの拡大: Databricksのサポートにより、RBはこれまでの10倍以上の顧客をサポートできるようになりました。Databricks導入前は、彼らの最大許容量は約45,000店舗でした。Databricks導入後は、約50万店舗まで急速にスケールしています。