本シリーズでは、Zadaraがマルチテナント推論クラウド向けのソフトウェア・リファレンス・アーキテクチャをどのように実現できるのかについて掘り下げていきます。
NVIDIAがマルチテナント対応の生成AIインフラ向けリファレンス設計を公開した今、そのビジョンを現実のクラウド環境でどのように実装できるのかを考える時が来ました。
Zadaraは、このビジョンを実現する最適なパートナーであると私たちは確信しています。
本シリーズでは、GPUネットワーキングからコントロールプレーンの分離に至るまで、リファレンスアーキテクチャの各要素を取り上げ、Zadaraがそれをどう支えているのかを具体的に紹介していきます。
まずは全体像を整理しましょう
NVIDIAのリファレンスアーキテクチャが求める要件とは?
そしてなぜ、Zadaraはすでにその要件に応える準備が整っているのでしょうか?
NVIDIAのリファレンスアーキテクチャが求めるもの
NVIDIAのソフトウェア・リファレンス・アーキテクチャは、クラウドサービスプロバイダーがスケーラブルかつセキュアで高性能なAIインフラを提供するための包括的なフレームワークです。
その中心となる設計思想は以下のとおりです:
-
真のマルチテナンシー
コンピュート・ストレージ・ネットワーク・オーケストレーションを含むスタック全体でのテナント間分離 -
AI特化インフラ
GPUトレーニングだけでなく、推論・データ処理・データベース・オーケストレーションレイヤーまでを含めたAIワークロード全体への最適化 -
動的なリソース割り当て
GPU、CPU、ストレージ、ネットワークなどのリソースをテナントやワークロード単位で柔軟にプロビジョニング・スケーリング可能 -
テナントごとのKubernetes環境
各顧客が自分専用のKubernetesコントロールプレーンを持ち、高い自由度と制御性を確保 -
エッジとコアの両方に対応
ユーザーの近くでの低レイテンシー展開と、中央集約型のクラウド展開の両方をサポート
さらに、AIモデルの複雑化により推論処理自体の計算負荷が増加しており、特に意思決定や計画、コード生成といった“推論型”のAIでは、GPUの実行時間やメモリ使用量が大きくなっています。
これにより、トレーニングだけでなくリアルタイム推論にも高性能で動的なリソース割り当てが必須となっています。
このような高度な要件を実現するために、NVIDIAは以下のようなハードウェアおよびソフトウェアを提供しています:
-
Spectrum-X:高速ネットワーキング
-
BlueField-3 DPU:ネットワーク処理のオフロードとセキュリティ強化
-
NVIDIA AI Enterprise:AIオペレーションを支える統合ソフトウェア群
✅ネイティブなマルチテナンシー対応
Zadaraは、コンピュート・ストレージ・ネットワークそれぞれにおいてテナントごとの分離を標準で提供しています。各テナントはインフラ上の独立したセキュアな領域で動作し、ポリシーに基づくアクセス制御も可能です。
✅ フルスタックなAIワークロード対応
現代のAIワークロードはGPUだけでは成り立ちません。Zadaraは、データベース、ベクトル検索エンジン、Kubernetesのコントロールプレーン構成要素など、AI/ML環境を構成するあらゆるワークロードをサポートします。
✅ テナント単位のKubernetes環境構築
Zadaraでは、テナントごとに専用のKubernetesコントロールプレーンを展開することが可能です。これはNVIDIAが推奨するアーキテクチャ(コントロールプレーンの分離)にも完全に対応し、柔軟な運用を実現します。
✅ 弾力的なリソース割り当て
Zadaraは、コンピュート・ストレージ・GPUといったリソースをテナントやワークロード単位で動的に割り当て可能です。これにより、インフラ資源の最適な活用と、迅速なスケーリングを実現します。
✅ グローバルなエッジ展開
Zadaraは、世界25カ国以上・500拠点超のエッジロケーションで稼働しており、200社を超えるリージョナルパートナーにより運用されています。これにより、RAGベースのLLMから複雑な推論処理まで、あらゆるワークロードに対して低レイテンシーなAI推論環境を実現。さらに、**データの地域要件(データレジデンシー)**にも対応できるという、リファレンス設計上のもうひとつの重要な要件も満たしています。
次回以降のブログでは?
今後の投稿では、NVIDIAの具体的な技術要素と、それらをZadaraがどのように支えているのかをさらに深掘りしていきます。
-
Spectrum-XとGPUネットワーキング: AIのための高性能データプレーンの構築方法
-
BlueField DPU: セキュアかつ高速なネットワーキング、シン・ハイパーバイザー、コントロールプレーンと実行プレーンの分離を実現
-
Kubernetesのコントロールプレーン分離: Zadaraによるテナントごとの大規模Kubernetesオーケストレーションの支援
これらの重要な構成要素を順に取り上げていきますので、どうぞお楽しみに。
マルチテナントAIクラウドの未来は、すでにここにあります――その基盤にはZadaraが使われています。
Zadara を体験する
エンタープライズ向けクラウドサービスがいかに使いやすくなるか、ご自身でぜひお確かめください。
→お問い合わせはこちらから