最近注目しているリアルタイム分析ツール"ZoomData"についてご紹介します。
ZoomDataとは?
ZoondDataはUS生まれのリアルタイム分析ツールです。ひとえに分析系のツールといっても様々なツールが存在しますが、ZoomDataはビジネスインテリジェンス(BI)系に位置づけられるツールになります。大量データのリアルタイム処理を得意とする特徴から今後BigData分野で注目される可能性があります。プロプライエタリなツールですが60日間はトライアルで利用できます。
デモでイメージをつかむこともできます。
適用領域
USでは金融機関などで使われ始めているようです。カードの不正利用検出や在庫管理といった即時性が求められる分野にフィットするようです。ただしセンサーや株価など超即時性を問われる場合には合わない可能性があります。先ほどリアルタイム分析ツールと紹介しましたが、正確には"ニア"リアルタイム処理になる為です。
仕組み
ZoomDataサーバから外部DBのデータを参照します。一定期間のデータがZoomDataサーバ内にキャッシュされます。オリジナルのデータを変更することはありませんが、参照されている間はDBに負荷がかかる点が注意です。大量のデータ処理の為に裏ではApache Sparkが動いています。
豊富なデータソース
特徴として豊富なデータソースへの対応が挙げられます。
- Aurora
- Cloudera Search
- Elastic Search
- Flat File(CSVファイルなど)
- Google Analytics
- HDFS
- Hive On Tez
- Impala
- Kinesis
- Marketo
- Mem SQL
- MongoDB
- MySQL
- Oracle
- Phoenix
- PostgreSQL
- Redshift
- S3
- SQL Server
- Salesforce
- SendGrid
- Solr
- Spark SQL
- Upload API(ユーザが自分で定義)
- Zendesk
使い始めるまで
ZoomDataはオンプレ版とクラウド版が用意されています。オンプレ用のZoomDataはLinuxパッケージで提供されます(Ubuntu or CentOS)。ZoomData用のサーバを構築して、そこに対してブラウザでアクセスする使い方になります。バージョン2.3からはスクリプトを実行するだけで簡単にインストールできるようになりました。
次回はオンプレ環境にインストールしてみたいと思います。