クラウドAIの世界は急速に進化しており、毎日のように新しい製品や機能が利用可能になっています。ビジネスユーザーとデータサイエンスチームの両方の増大するニーズを満たすための最高のクラウドとAI機能を探そうとしている分析チームのリーダーとビジネスリーダーにとって、このような流動的な状態は課題です。アーキテクトにとっての課題は、クラウドの展開の容易さ、コスト、およびスケーラビリティーの利点を活用しながら、企業のニーズを満たすテクノロジーを選択することです。
AWS用のDataikuクラウドスタックアクセラレーターは、AWSのクラウドインフラストラクチャーとサービスを最大限に活用し、ビジネス、分析、およびデータサイエンスチームに対して包括的なAI機能のセットを提供します。新しいアクセラレーターを使用することで、クラウドアーキテクトと管理者は、DataikuのEveryday AIプラットフォームのデプロイ、構成、および管理を自動化できます。テンプレート駆動型のクリック操作が可能なインターフェースにより、管理者は新しいチームによるエラスティッククラウドAIのデプロイを簡単に制御および管理でき、既存のグループについては維持およびアップグレードが可能です。
Dataikuクラウドスタックアクセラレーターを使用することで、チームは3つの簡単なステップでAWS上のDataikuを稼働させることができます。
ステップ1:ネットワーク、VPC、およびセキュリティー
Dataikuクラウドスタックアクセラレーターは、既存のAWS仮想プライベートクラウド(VPC)トポロジーのネイティブテクノロジーを使用します。サブネット、セキュリティーグループ、ルーティングコントロールを使用してインフラストラクチャーを分離することができる、セキュリティーコンポーネントを活用します。
Dataikuクラウドスタックテンプレートをデプロイする前に、クラウドアーキテクトは、Dataikuインスタンスを作成/削除/実行するためのアクセス許可、セキュリティーグループを作成するためのVPCアクセス許可、およびDataikuロールをDataikuインスタンスに渡すためのIDアクセス管理(IAM)アクセス許可を作成します。このステップでは、データサイエンスプロジェクトにエラスティックコンピューティングクラスターが必要な場合に、クラスターのアクセス許可を簡単に設定することもできます。
クラウドスタックテンプレートはAWS CloudFormationコンソール内から起動され、AWSアカウント内で完全に管理されるため、すでに安全なクラウド環境上で操作しているということになります。フリートマネージャーテンプレートへのリンクをAWS CloudFormationサービスに入力します。リンクはこちらで取得できます。
Dataikuテンプレートを指定することで、スタックオプションを構成して、クラウドリソースを作成する場所と、出力リソースに安全にアクセスする方法を定義できます。適切に割り当てられた役割と権限を持つ管理者のみがスタックを変更でき、すべての変更はログに記録され、包括的な監視と制御の実現のために監査可能です。
ステップ2:Dataiku for AWSをデプロイする
Dataikuは、すぐに使用できる4つのデプロイテンプレートを開発しました。これらによりユーザーは、プラットフォームの使用を開始し、AIおよび分析プロジェクトを構築および開発し、AWSクラウドでそれらを本番化するために必要なものをすべてを備えたDataikuをデプロイできます。これらのテンプレートは、組織または基幹業務の要件に合わせてカスタマイズできます。
これらのデプロイテンプレートは、データパイプラインとモデルを構築するためのシングルノード設計環境から、Kubernetesクラスターなどの弾力性のあるリソースを必要とする中小規模のデータサイエンスチーム向けの弾力性のある環境まで、さまざまなアーキテクチャーの青写真を提供します。
完全な青写真を得るには、[フルフリートの展開]オプションを使用します。このテンプレートにより、S3ストレージ、Redshift、Kubernetesなどのマネージドサービスへの接続を含むエラスティックAIコンピュートクラスターをプロビジョニング、管理、拡張することが可能なエンタープライズ向けのエラスティックAIスタックを導入でき、また、データ準備、モデルの学習、 本番環境へのデプロイなどのタスクをサポートします。これらは全て、EC2仮想マシン上の安全なAWSクラウド内ですべて実行されます。
Dataikuがデプロイされると、データサイエンスチームは、AthenaやGlueなどの追加のAWSマネージドサービス、またはAmazon ComprehendやRekognitionなどのNLPまたはビジュアル用のAIサービスに接続し、これらを利用できます。
ステップ3:Dataiku for AWSのメンテナンス、拡張、アップグレード
Dataiku on AWSを使用すると、ITオペレーターまたは管理者は、追加ユーザーのオンボーディング、グループの追加、新しいDataikuインスタンスのデプロイなどの日常的なタスクを簡単に管理できます。また、テンプレートは使いやすいため、IT部門は必要に応じて制御を維持したり、プラットフォーム管理をDataiku管理者に委任して管理オーバーヘッドを削減したりできます。管理者は、一元化されたビジュアルインターフェースを介してDataikuインスタンスを簡単に監視できます。テンプレートを使用すると、Dataikuの将来のバージョンへのアップグレードも簡単になります。Dataikuは各リリースをイメージとしてプッシュするため、AWSアカウント内で公開されます。ドロップダウンメニューから新しいバージョンを選択するだけで、アップグレードできます。
最後に、ビジュアルインターフェースを使用して、ディザスターリカバリーの目標復旧時点とスナップショットの頻度を設定することもできます。Dataikuは、リカバリー機能にEBSスナップショットを活用して、データとAIプロジェクトの損失を回避するために簡単にリカバリーや再デプロイができるようにします。AWS向けの新しいDataikuクラウドスタックアクセラレーターを使用することで、分析チームリーダー、クラウドアーキテクト、管理者は、ビジネスチーム、データサイエンスチーム、およびIT運用者のために、クラウド上のAIを制御および管理でき、AWSサービスやインフラストラクチャーへの既存投資を最大限に活用できます。
Dataiku for AWSをさらに活用する
チーム(ビジネス、分析、データサイエンス)は、クリック操作のコーディング不要のインターフェースを介して、AWSにDataikuを迅速にデプロイし、維持することができます。その方法については、こちらよりご覧ください。AWSデータソースに簡単に接続し、データを準備して分析し、AIと分析プロジェクトを数週間や数か月ではなく、数時間で構築することができます。