Forbesは、テクノロジー分野における最もホットな領域であるクラウド技術をリードする企業を評価する「Forbes Cloud 100」にDataikuを選出しました。今回は、クラウド環境におけるAI、機械学習(ML)、アナリティクスに関して、Dataikuが業界のリーダーである理由をご紹介します。
全てのクラウドデータへ直ぐにアクセス
ガートナー社が発表した「Market Guide for Data Science & ML Engineering Platforms」によると、データサイエンスと機械学習の採用を進める要因の一つとして、ハイブリッド型・マルチクラウド型環境の全てのデータにアクセスし、データエンジニアリングやモデルトレーニングに必要な演算リソースを必要に応じて調整できるスケーラビリティを提供することであると発表しました。
Dataikuは、AWS、Microsoft Azure、Google Cloud Platform、Snowflake Data Cloudなど、主要なクラウドプラットフォーム上のあらゆる種類のストレージに、あらかじめ組み込まれた統合機能によって、あらゆる規模のデータをシームレスに接続します。また、このプラットフォームは、データが存在する場所に処理をプッシュダウンするため、お客様のデータは、安全で管理された、コンプライアンスに準拠したクラウドストレージから離れることはありません。
マルチクラウド&クロスクラウド
Dataikuは、データのサイロ化をなくし、アナリストやデータサイエンティストがすべてのクラウドデータを扱えるようにします。また、Dataikuは、SnowflakeやDatabricksなどのクラウドデータウェアハウスやデータレイクと統合し、ユーザーが異なるクラウド環境間のデータにアクセスできるようにします。
Dataikuはクラウドデータへのアクセスを容易にするため、データサイエンティストが複数のクラウドインフラを管理ための作業に時間を削減し、AIの構築に集中することができるようになります。また、クラウドとオンプレミスにまたがるすべてのデータを活用し、最もパフォーマンスと堅牢性の高いモデルを実現することができます。
スケールに応じたクラウドコンピューティング
Dataikuは、クラウドコンピューティングに完全にマッチしたプッシュダウンアーキテクチャを備えています。このアーキテクチャにより、ユーザーはクラウドプロバイダの自動スケーリング機能を利用することができます。データの移動を無くし、最適なクラウド実行エンジンに処理をプッシュすることで、時間とコストを削減し、クラウドインフラを最大限活用することができます。
より早くインサイトを導き出すための柔軟性
Dataikuは、データサイエンスのあらゆる部分にクラウドの柔軟性を取り入れ、AIモデルからビジネスバリューを導出する時間を劇的に短縮することに取り組んでいます。例えば、Dataikuは、Sparkの分散処理とクラウド上のKubernetesを組み合わせることで、最もパフォーマンスの高いAutoMLエンジンを作りました。このイノベーションによって、Dataikuのお客様がインサイト導出に要する時間を70%以上短縮しました。
Kubernetesを活用した大規模APIデプロイメントの高速化
Dataikuは、Kubernetesクラスタのセットアップを簡素化することにより、クラウド上でAPIサービスをデプロイすることを容易にしました。Dataikuは、APIサービスをデプロイするために、Amazon Elastic Kubernetes Service (EKS), Azure Kubernetes Service (AKS), Google Kubernetes Engine (GKE) など、クラウドKubernetesサービスへの統合を可能にしています。ユーザーは、コードを使用してこれらのサービスに接続・設定を行うことなく、視覚的なインターフェイスで数回のクリックだけで、特定のクラスタや動的なクラスタに簡単にアクセスすることが可能です。
SaaS&BYOインフラ
ほとんどのAIと分析プラットフォームは、フルマネージドまたはセルフマネージドのどちらかですが、Dataikuは、そのプラットフォームをクラウドの両方で提供しています。フルマネージドSaaSの提供により、Dataikuはすべての管理、ホスティング、およびインフラストラクチャを処理することができます。お客様は、サーバーや管理、アップグレードについて心配する必要はなく、Dataikuがすべて処理するので、お客様はアナリティクスやAIに集中することができます。
より多くのコントロールとカスタマイズを望む企業は、クラウドスタックアクセラレータを備えたセルフマネージドAIプラットフォームとして、Dataikuを迅速にクラウドに導入することができます。このクラウド展開は、AWS、Microsoft Azure、Google Cloud Platformとの提携により開発されたベストプラクティスのブループリントを使用して、選択したクラウドプロバイダーにDataikuを展開するノーコードパスを提供します。また、このアプローチは、自己管理クラウド展開の管理と技術的負担を軽減します。
クラウドパートナーとの革新的な取り組み
Dataikuは、クラウドテクノロジーアライアンスの広範なエコシステムを構築し、戦略的統合に幅広く投資して、データサイエンティストがストレージやコンピューティングインフラにシームレスに接続し、AIやMLのプロジェクトをあらゆる規模で効率よく行えるようにサポートしています。
例えば、Dataikuは、Snowflake Data Cloudとの幅広い統合を構築しました。この統合により、データサイエンティストはSnowflakeの自動スケーリングと超並列クラウドコンピュータクラスタ、さらにSnowparkとUDFを活用して、データ準備と変換の実行をSnowflakeにプッシュダウンし、高速でコスト効率の高い処理を実現することができます。
Dataikuは、AWS Marketplace、Google Cloud Marketplace、Azure Marketplace、Snowflake Partner Connectなど、あらゆるクラウドマーケットプレイスからアクセスすることが可能です。また、Snowflake Partner Connectを利用すれば、ユーザーはわずか数分でDataikuインスタンスを立ち上げることができ、クラウドの力を活用することができます。
→「5分でできるSnowflakeとDataikuの接続方法」の動画はこちらのビデオから視聴できます
マイクロサービスとデータプロダクトのデプロイが可能
Dataikuは、セルフサービスによるデータサービスの公開と利用を可能にします。Dataikuは、ほとんどのマイクロサービスアーキテクチャに準拠したデプロイ可能なマイクロサービスとして「データプロダクト」を生成することができ、データメッシュの実現に貢献することができます。データサービスや推論エンジンの利用を容易にするために、Dataikuはマイクロサービスアーキテクチャを利用してデータサービスや推論エンジンを公開することができます。このアプローチにより、データメッシュ戦略が可能になり、よりアジャイルで信頼性が高く、ガバナンスの効いたクラウドデータアーキテクチャを構築することが可能です。
ディープラーニングとクラウドAIサービス
近年、コンピュータビジョンや自然言語処理など、膨大なデータセットと複雑なアルゴリズムに依存する高度なAIユースケースを追求する企業が増えています。ディープラーニングモデルは、通常GPUを必要とすることで知られており、企業はモデルをトレーニングするために必要な資源を得るためクラウドに注目してきました。
Dataikuはクラウドパートナーとの連携により、ディープラーニングの前処理タスクをプッシュダウンします。DataikuはクラウドGPUまたはお好みのクラウドプロバイダのGPUでディープラーニングモデルをトレーニングすることができます。