多くの企業のデータ サイエンス チームや分析チームは、クラウドプラットフォームと組み合わせて、より素早く利用できるサービスはないか?と検討しています。その解決策として、Dataiku と Google Cloud Platform (GCP) はパートナーシップを組み、GCP向けのDataikuクラウドスタックアクセラレータを提供しています。
GCP向けのDataikuクラウド スタック アクセラレータとは、GCP 上で Dataiku をデプロイ・管理できる、テンプレート化したアプローチです。これによって、Google の強力で柔軟なコンピューティングインフラストラクチャ上に、自己管理型の AI プラットフォームを数時間で構築できます。Dataiku for GCPを使用すると、ユーザーは AI/ML プロジェクトの価値実現までの時間を短縮でき、IT 管理者はインスタンスのデプロイと管理をより簡単に行うことができます。
Dataiku を使用した際、GCP ユーザーは、ストレージとコンピューティングの両方でGCPと統合することができます。Google BigQuery などのGCP クラウド サービスに統合して、クラウドの既存投資を活用できます。GCP データに接続したら、計算はGCP 側にプッシュして処理できるため、データをクラウドに保護したまま実行できます。
GCP のユーザーは、Dataiku クラウドスタックアクセラレータを使用して、Google Kubernetes Engine (GKE) を利用したエラスティック AI クラスターをデプロイできます。これによって、モデルのトレーニングやスコアリングなどのデータ サイエンス処理をスケーリング可能になります。また、Dataiku から、Dataproc、Looker、Google スプレッドシート、NLP、ビジョン AI サービスなどの多くのサービスに、追加で連携できます。
図 1. Dataiku と、 GCPの人気のあるクラウド サービスへのネイティブ統合機能
3 つの手順でデータと AI スタックを取得する
ユーザーがメニューから処理内容を選択する方式で、 次に挙げる3 つの手順で開始します。この際、Dataikuで設定した処理を、Kubernetes (GKE) を利用したエラスティックコンピューティングクラスターで実行する機能など、データと AI スタックを完全に連携して稼働させられます。
手順 1: Fleet Manager と Dataiku インスタンスのサービス アカウントの作成
GCP向けDataikuクラウドスタックアクセラレータは、フリートマネージャーと呼ばれる機能を使用します。この機能によって、1 つまたは複数の Dataikuインスタンスをデプロイ、アップグレード、バックアップ、復元、構成を、容易に実行できます。Dataiku のインスタンスのライフサイクル全体を処理するので、管理者は多くの管理タスクから開放されます。フリートマネージャーの管理コンソールは、Google Cloud アカウント内で 使用でき、Dataiku をデプロイ・管理することができます。
最初の手順は、サービス アカウントを2つ作成することです。1つはフリート マネージャーのテンプレート用、もう1つは Dataiku インスタンス用です。管理者は、この最初のデプロイの手順で、役割と権限を割り当てられます。役割と権限は、Dataiku の高度なセキュリティ オプションと GCP Identity and Access Management を使用して、後でさらに詳細に設定できます。
手順2: Fleet Manager のデプロイと Dataiku のプロビジョニング
フリート マネージャーは、 VPC でホストします。管理者は、 2 つの簡単なコマンドラインでフリートマネージャー機能にアクセスできます。フリートマネージャーにログインしたら、Quick Start Blueprints のメニューから [Deploy Elastic Design] オプションを使用して、Dataiku インスタンスをデプロイします。このオプションでは、Kubernetes (GKE) を利用してエラスティック AI 機能を備えた Dataiku をデプロイします。
図 2: 最初のリソースと役割を割り当てた後、クラウドスタックアクセラレータは、Dataiku インスタンスをデプロイするためのワンクリック オプションを4 つ提供します。GCP ユーザーは、柔軟な設計オプションを利用できます。
1つのインスタンスに対し、Dataikuの設計ノード、自動化ノード、デプロイヤーノードといった単一のノードをインストールし、専用の仮想マシンで各インスタンスを動かします。インスタンスをプロビジョニングすると、クラウドスタックアクセラレータは、Dataikuのノードをホストするために必要なクラウド リソースを作成します。
手順3: GCP サービスに接続し、AIの使用を開始する
Dataiku をデプロイしたら、Dataikuで、次のようなGCP サービスを利用することができます。
GKE を介して計算をスケーリングします。
BigQuery をインプットとアウトプットに指定して、インタラクティブなクエリ レシピを実行します。
Dataiku のビジュアル レシピを、 BigQuery にプッシュ ダウンして実行します。
Google Container Registry を使用して Docker イメージを管理します。
Looker API にクエリを投げて、Looker のデータセットを読み込みます。
Google の互換性テストと最適化が行われた TensorFlow を利用して、Keras Python インターフェースを使用したディープ ニューラル ネットワークのトレーニングと推論を行います。
Google の自然言語およびビジュアル AI サービスを使用します。
図3: Dataiku for GCP を 3 つの手順でデプロイします。バックアップ、ワンクリックでのアップグレード、追加インスタンスの簡単なデプロイなど、インスタンスを管理できます。
わずか 3 つの手順で、完全なエラスティック AI スタックが完成します。管理者は、自動の運用・保守機能を使用して Dataiku インスタンスを維持・管理できるようになりました。
メンテナンスを自動化して IT 要件を軽減
GCP 向けの Dataiku クラウド スタック アクセラレータは、Dataiku インスタンスの継続的な管理とメンテナンスに使いやすい、テンプレート化されたアプローチです。これは、Dataiku を最新バージョンに素早くアップグレードし、バックアップ、復元、およびロールバックを容易にします。また、新しいインスタンスを簡単にスピーディにプロビジョニング可能にします。シンプルなメニュー方式の画面なので、多くのユーザーにとって使いやすい仕様になっています。Dataiku for GCP を使用すると、データ チームと分析チームがクラウドで AI / ML を採用することの価値を最大限に体験することができます。
Dataiku のEveryday AIプラットフォームのパワーを GCP で体験してください
Dataiku for GCP を使用すると、管理者やIT担当は、クラウド AI を管理するのに必要なすべてのツールを手に入れられます。データ サイエンティストは、クリック操作で実現するML ツールを、 GCPのコンピューティング、ストレージ、AI 開発サービスを活用しながら、AI プロジェクトの準備、構築、デプロイをより早く行うことができるようになります。詳細はこちらから。
原文: Accelerate AI Adoption: 3 Steps to Deploy Dataiku for Google Cloud Platform