この記事は Redash Advent Calendar 2017 6日目の記事です。
最近、業務でRedashを導入しました。
まだ、使い始めたばかりで小規模ですが、そのあたりのRedashの利用事例として、メリットを書きます。
Redash利用用途
ログ/データのアドホックな調査や可視化の環境に使用しています。
対象ログ/データは以下がメインです。
- サービスログ
- 例:) 広告系(クリック,コンバージョン), KPIログ...
- システムログ
- 例:) アクセスログ, パフォーマンスログ, セキュリティログ...
- サービスデータ
- 例:) マスタデータ, 中間データ, アカウントデータ...
- システムデータ
- 例:) サービスディスカバリデータ, 監視/モニタリングデータ...
Redashの規模感
- 実行クエリ数 約200/日
- 登録データソース 56
- 登録クエリ数 62
- ダッシュボード数 8
Redashのメリット
3つほど記載します。
- 画面開発工数の削減
- データ活用性向上
- 超シンプル
画面開発工数の削減
Redashは、クエリを保存し共有、クエリからチャートを作成しダッシュボード化することができます。
非エンジニアが、アドホックな調査目的で使用する画面を簡単に用意する事ができ、画面開発のエンジニア工数の削減が出来きました。
// 任意のパラメータを与えて登録クエリを実行し、ログ/データの抽出
データ活用性向上
Redashは、豊富なデータソースへ対応してるので、データへの一元的なアクセスが可能です。
エンジニアが、アドホックな調査目的で、インスタンスにログイン(SSH等)したり、管理画面(AWSのマネコン等)にログインしたりする手間がなくなりました。
現在、以下へRedashからクエリを投げられるようにしています。
- AWS Athena
- AWS RDS for Aurora
- AWS RDS for Mysql
- AWS RDS for PostgreSQL
- AWS DynamoDB
- AWS ElasticSearchService
- AWS EMR Hive
- AWS EMR Presto
- Hadoop CDH Hive
- Hadoop CDH Impala
- Google spreadsheet
また、Redash Advent Calendar 2017 1日目のRedash v3.0.0で追加されるQuery Resultsデータソースについての方法で、異なるデータストア間のクエリをJoinする事が可能です。
簡単なユースケースにはとても便利で、全てのデータのJoinを期待でき、データ活用性が向上できました。
ただし、これらはRedashのインメモリで行われ、HadoopやMPPエンジンのような分散アーキテクチャを持っていません。データセットが大きい場合は、スケールしないので、RedashのハブとしてPresto等を検討したほうが良いかもしれません。
超シンプル
Redashは、画面自体が超シンプルです。Redashは、Tableauとかと異なり、エンジニア向けのツールだと思っています。
エンジニアだと、Redashのマニュアルを読まなくても、そのままRedashを活用する事が出来ました。
企業内だと、何か新しい技術を導入するよりも、それを広めたり、文化を作ったりする方が大変です(ケースによると思いますが)。
Redash利用にあたって、学習コストがとても低く、超シンプルなので、この辺りの活動工数を大きく抑える事ができました。
おわりに
社内勉強会ですが、話しました。
そのときのスライドです。