はじめに
職場では、新しいツールの評価や自己学習のため自由に使えるLinux環境を希望者には支給してもらえます。
ただ試すだけならローカルに立てたDockerで事足りるのですが、固定のIPが振られ他のメンバーと共有できる環境がもらえるのはありがたい事です。
今年4月ごろから、その環境を利用してRedashを立てて使い始めているのでその話をしたいと思います。
(ちなみに、CentOS7 + Docker composeで環境を作っています。)
Redashとは
公式サイトから意訳です。
オープンソースであり、SQLを書いていくスタイルで、簡単に共有ができて、エンジニアにとって非常に使いやすいものとなっています。
Redashは、データの問い合わせ、視覚化、共同作業を行うためのオープンソースのツールです。
問い合わせ結果とダッシュボードを他のメンバーと共有することができ、コードのフィルタやパラメータを即座に調整して組織全体のデータ駆動力を強化することができます。
メール、Slack、またはHipchatに事前定義されたトリガーのアラートを取得します(カスタムWebhookも設定できます)。
Redashは文化や使用パターンに合わせて、会社内のデータを解放します。従来のBIスイートは、遅くて/煩雑なフローなのに対し、Redashはエンジニアが使いやすいアプローチをとりました。
Redashは、Amazon Redshift(ペタバイト規模のデータウェアハウス)を使用して処理して収集する、何十億ものレコードにすばやく簡単にアクセスできるように構築されました。今日Redashは、Redshift、Google BigQuery、Google Spreadsheets、PostgreSQL、MySQL、Graphite、Axibase Time Series Database、カスタムスクリプトなど、複数のデータベースのクエリをサポートしています。
導入したきっかけ
もともとデータ分析はしていたのですが、事前に用意された切り口以外の分析をしたい場合は
SQLを書いて実行して、エクセルでグラフにして、というのを各々がしていました。
共有する仕組みがないので変更した場合の再配布が面倒だったり、似たようなSQLを各々が作っている非効率な状態を改善したくて試しに導入してみました。
導入した効果
私は主に、稼働時間やRedmineのチケットの分析に使用していますが、
「体感的にはそうでもないけど、会議にどれぐらい時間を使っている」とか、「見積もりに対して実績はどれぐらいかかっている?」とか、「過去に行った類似機能の開発ではどれぐらい掛かっていた?」というのがパッと分かるようになりました。
自分が知りたい情報に、 タイムリーに、 時間と手間をかけずに、 視覚化して見れるようになったのは非常に大きいです。
他の人がどんな分析をしているのかを見たり、気に入ったものをフォークして使うなど、コラボレーション的な面でも効果があると思います。
すでに報告書などにも使われていたり、「もはやRedashなしでは運用できない」という声もあるので、もはやお試しとは言えないレベルに活用されてきています。(正式なツールになる日も近いかな。でも今の緩い運用も捨て難い。。)
エンジニアが使うツールはエンジニアが選ぶべきですね。
最近の追加機能のご紹介
話は急に変わりますが(あまりに脈絡がないので後日別記事に分けるかも)、当初v1.0.1を導入して、先日やっと3.0にバージョンアップしました。
(現在は4系が開発中なようで進化が早いですね)
最近のバージョンで追加されたであろう便利な機能を紹介します。
Query Resultsデータソース
query_<query ID>
と指定することで別のSQLの実行結果をテーブルのように参照できる仕組みが追加されました。
例えば、http://demo.redash.io/queries/5949
というURLのクエリーならquery_5949
で参照できます。
では実際にやってみましょう。
- 事前に以下のSQLが登録されている前提とします
select id, org_id, name from data_sources;
select id, name from organizations;
- Type=
Query Results(Beta)
を選択してデータソースを追加します。
- 作成したデータソースを使用すると、
query_1
,query_2
をテーブルのように使用できました。
もちろん異なるデータベースのテーブルでも大丈夫ですので、DBリンク的な使い方ができます。
ただしインメモリーのSQLiteで実行されるため、あまり大量データは処理できないとのことです。
Dropdown List
以前から{{paramName}}
でプレースホルダを使用できましたが、プルダウン形式で選択できるようになっています。
やってみましょう。
- プレースホルダーの設定アイコンをクリックします。
-
Type
は「Dropdown List」を選択、Dropdown List Values
に改行区切りで候補となる値を入力します
- そうするとプルダウンから値を選択可能になります
- 今度は、Typeに
Query Based Dropdown List
を選択し、Query to load dropdown values from:
に既存のSQLを選択すると同じようにSQLの実行結果がリストになります
Queryフィルター
select id, name as "Name::filter", description, query from queries;
Select句に as <columnName>::filter
のようにaliasをつけると、検索結果のフィルタリングができます。
Where句で絞り込んだ結果をさらに絞り込みたい場合に便利ですね。
また、下記のように as <columnName>::multi-filter
とすると複数選択可能になります。
select id, name as "Name::multi-filter", description, query from queries;
Dashboardフィルター
ダッシュボード名を任意の名前:ダッシュボード名
とすりことで、絞り込みができます。
ダッシュボードの数は増えてくると思うので組織なり、カテゴリーで接頭句を決めておくと絞り込みやすくなるでしょう。
最後に
まだまだ利用者募集中ですので、興味を持った弊社の方はご連絡ください。
非エンジニアの方にも使って頂けるようになると最高だな。
来年はalert機能をもっと活用したり、プロダクトのログを分析したいと思っています。