#前回の続き・・・
今回は、試用期間限定(30日間)のZoomdata環境を構築する手順等を解説していきたいと思います。
現在、「デジタルトランスフォーメーション」なる長文字熟語が巷を騒がせていますが、その関連バズワードとして「データドリブン」という熟語も聞かれた事があるかと思います。
データドリブンなxxxという考え方は、ある意味正しくIT環境を表す言葉でもあり、色々な意味で高品質なデータ(結果)を効率よく獲得するために、色々な可能性や視点、考え方から導き出される関連パラメータ(データ)を利活用(マイニング)する事で実現していく・・・環境構築が、ある意味ITの活用領域の重要なポイントでもあると言えるでしょう。
データの為に、データを諦めないでフル活用し、より高品質なデータを創造していく・・
この可視化サイドのソリューションとして、Zoomdataを使って頂けば十分お役に立てるかと思います。
###AI/BIの前にCIという考え方・・・
現在、AIというキーワードが関係各方面を席捲しているような状況ですが、その前にBIというツールを使いこなして、より高いレベルの業務改革や改善、また新たなビジネス創出を!という大きな流れが有りました。もちろん、逆の意味でBIは一般化して普通の業務ツールとして進化を続けていますが、基本的に高度な分析ノウハウ(度のデータを選択し、その方式で分析するか‥など)が必要な世界でもあり、データサイエンティストなる職域に脚光が当たり、新たなチャレンジ領域として専門知識の習得をされている状況なのではないかと思います。
さて、ここで素朴な疑問が・・・・
BIブームが始まる前に、各種の表計算とその可視化環境を使って、グラフ化しながら報告書や企画書を幾つも作ってきた経験や、週末・月末・期末・年度末の前に、表計算をフルに駆使して資料を作成してきた経験が有ったかと思います。また、オフィスに散在するPCには、殆どのケースでこの辺の関連アプリケーションが組み込まれており、それを使いこなす事が社会人の最初のハードル!だった記憶もお持ちなのではないでしょうか?
データ同士の組み合わせや関連する計算式は、基本的に業務経験や業務自身に深く結びつき、その経験の蓄積は有る意味CI(Chart Intelligence)というデータ利活用の基本ともいえる世界だと言えますが、現実的にはこのレベルの作業で殆どの現場洞察を得る事が出来たかと思います。(業務経験ドリブンな可視化により)
しかし、ここに大きな問題が存在しているのも事実です・・
それは、データのサイズや種類を諦めなければならない・・という、極めて現実的でCIの活用横展開を阻む大きな問題の存在です。基本的に扱うデータを処理するコンピュータが目の前のパソコンである事が殆どで、その性能・仕様に大きく依存するのが、このCIの活用限界だとも言えるでしょう。また、実際にはこの制限については、その発展形であるBIのレベルでも同様に顕在化し、複雑系や対象データ範囲の大きな処理では、それなりの仕様のマシンをフル稼働させて作業を行う必要があります。
##データを諦めないCIでデータドリブンを・・・・
Zoomdataが提供できる世界は、データドリブンの基本形でもあり、また現在でも殆どのケースにおいて十分活用可能なCI作業を、最新のクラウド転用可能な仕組みで実現し、同時にデータの量や種類を諦めないCIをエンタープライズ規模でシンプルに実現出来る環境になります。
さらに、データを諦めないCIをより強力に支援するために、独自のJoinエンジン(データフュージョン機能)を活用した、データの種類を跨いで仮想的に一つのテーブル化し、その結果を即時CI利用できる!という環境も提供しています。
また、これらのCI出力は、業界標準のWebコンテンツ環境に最適化され、汎用のブラウザ経由で場所や出力デバイスを選ばないCI活動を強力に支援すると同時に、既存のWebベースのデータサービスに組み込む事で、新たなデータビジネスの可能性を同時に提供可能な仕組みでもあります。
##では、具体的にZoomdataを試してみる・・・には?!
まず最初にZoomdata社のホームページに移動します。
ブラウザの右上にある「Free Trials」を選択します。
必要項目を間違いない様に記入して、最後のチェックを忘れずに行って「Submit」ボタンを選択します。
Zoomdata社の規定の社内プロセスを経た後、登録されたメールアドレスへ試用環境構築に関するメールが送られて来ますので、その手順に従って作業を行って頂ければOKです。
###事前の準備について
ハードウエア環境は、基本的に試用目的に依存しますが、小規模なお試しレベルで有ればハイエンドデスクトップ(Core i7:4コア,8スレッド)程度でも十分動作します。また、基本的にメモリ喰いの仕組みではありますので、メモリは16GB以上(32GB有れば、結構な規模まで行けると思います)用意して頂けば良いでしょう。もちろん、IAサーバに本格的な構築を行えば、本番に耐えられるような規模のCI作業が実施可能です。
さらに仮想環境でも動作が可能ですので(CPU,メモリについては、殆どオーバーヘッド無しで利用出来るようになりましたし、ストレージについても、SSD等を使えば十分試用可能になると思います)検討対象にして頂いても問題ありません。
(1)OSについて
基本的にピュアLinux(クラウドベンダーが提供するカスタマイズ版ではない)でレッドハット系とデビアン系で動作しますので、その準備を事前に行っておいてください。また、以前のZoomdata環境ではOracle系のJava8も事前導入しておく必要がありましたが、今回対象のバージョン4.9では、Javaの依存性をニュートラルに持ってきていますので、CentOS7等に付属のオープン系Java8で動作が可能です。
(2)インストールについて
原則的に必要な環境を全てネットワーク経由で自動的に導入設定致しますので、試用環境を外部アクセス可能なネットワーク環境に接続してください。また、Zoomdataは内部でPostgreSQLを使っていますが、独自の設定を施しますので、原則としてクリーンな環境をご用意頂くようにお願い致します。
##試用ライセンスの申請について
正常にインストールされたZoomdataを最初に起動すると、幾つかの規定アカウント(アドミニストレータとスーパーバイザ)に対するパスワード設定が要求されますので、ポップアップウインドウ上に表示されているルールに従って設定を行ってください。
supervisorアカウントで入って頂き、左上のアイコンを選択して頂きます。
赤い部分の情報を正しく読み取って頂いて、Zoomdata社へ送り戻してください。
正式に認定された後、今回送られてきたインスタンスIDに対して30日間有効な試用ライセンスが送られてきますので、その情報を正確に「New License Key」のフィールドに転写してください。
##次回以降の予定・・・・
次回から、このZoomdata可視化環境と、MemSQL上に展開したサンプルデータ(CSVデータの読み込みを予定)を使った可視化実験を行いたいと思います。