IntelAI
所属: インテル
05-05-2025
Pauline Essalou、Megan Kuo 共著
インテルと IBM は 4月に開催されたイベント「Intel Vision 2025」において、インテル® Gaudi® 3 AI アクセラレーターの IBM Cloud での提供開始を発表しました。この発表は、パブリック・クラウド環境で初めてインテル® Gaudi® 3 AI アクセラレーターを本番ワークロードに活用できる重大なマイルストーンであり、効率と費用対効果を重視しながら AI ワークロードを大規模展開したいと考えている多くの企業にとって大きな前進を意味します。この画期的なソリューションは、今週ボストンで開催されているイベント「IBM Think」でも紹介され、効率的で費用対効果の高いソリューションを目指すインテルと IBM の長期的なコラボレーションを強調するものとなりました。このソリューションは、パフォーマンス、信頼性、スピードの向上と AI ワークロードの大規模展開を目的に設計されています。
IBM Cloud でインテル® Gaudi® 3 AI アクセラレーターを利用できるようになったことで、企業は最先端テクノロジーにより AI 推論処理を加速する、強力なプラットフォームへのアクセスが可能になります。高スループット / 低レイテンシー設計のインテル® Gaudi® 3 アクセラレーターは、大規模言語モデル (LLM) や生成 AI といった複雑な AI ワークロードを動かす、大規模アプリケーションの運用に最適です。128GB の広帯域幅メモリーと 3.7TB/s のメモリー帯域幅によって高速データ・スループットを実現し、ボトルネックを激減させ、大量のデータセットを圧倒的な速度で処理します。
性能ベンチマークは、従来のソリューションを上回るインテル® Gaudi® 3 アクセラレーターの競争優位性を際立たせました。コンテキスト容量の大きい Llama-3.1-405B-Instruct-FP8 モデルを実行するシナリオでは、競合 GPU と比較して最大 36% 高いパフォーマンスを達成。1 さらに、インテル® Gaudi® 3 アクセラレーターは 1 ドル当たりのトークン数が競合 GPU よりも最大 92% 多いという、ずば抜けたコスト・パフォーマンスを示しています。1 これは AI 運用の拡張を考えている企業にとって、目を見張るほどコスト効率の高いソリューションです。詳しくは、こちらの性能ベンチマークをご覧ください。
IBM Cloud で実行すると、インテル® Gaudi® 3 アクセラレーターそのもののパフォーマンスにとどまらず、エンタープライズ AI インフラストラクチャーの多様なニーズに応える、柔軟な導入オプションが提供されます。IBM Cloud の Virtual Private Cloud (VPC) 環境内で、各社の IBM watsonx.ai ソフトウェア・ライセンスを、インテル® Gaudi® 3 アクセラレーターを搭載した仮想サーバーへの AI ワークロードの実装に使用し、独自の AI スタック全体を制御することも可能です。IBM Cloud では AI 運用をさらに効率化するために、Deployable Architectures (DA) と呼ばれる AI ソリューションの実装をスムーズにする事前コンフィグレーション済み設計モジュールの導入を予定しています。この DA には、エンタープライズ AI 向けインテル® AI、OPEA Productivity Suite、Red Hat OpenShift on IBM Cloud などが含まれており、開発者や IT チームは設定と手作業の負担を最小限に抑えて AI 導入が可能になるため、価値の創出までにかかる時間が大幅に短縮されます。
インテルの次世代ハードウェアを IBM のクラウド・インフラストラクチャーや AI ツールと組み合わせることで、AI の可能性を最大限に引き出し、イノベーションを加速して、投資利益率を最適化することができます。
IBM Cloud でのインテル® Gaudi® 3 アクセラレーター活用による最新の進歩については、IBM Cloud GPU and AI Accelerator からご覧いただけます。今すぐ AI インフラストラクチャーの変革を開始してください。
1 出典: Signal65 Lab Insight Whitepaper - Intel® Gaudi® 3 AI Accelerator at Scale on IBM Cloud、インテルの委託により Signal65 が実施した調査、2025年4月22日公開。レポートに記載されている数値は推論処理によりインテル® Gaudi® 3 アクセラレーターと NVIDIA H200 を比較した結果です。ワークロードと構成については、出典元のページを参照してください。結果は異なる場合があります。
https://signal65.com/research/ai/signal65-lab-insight-intel-gaudi-3-accelerates-ai-at-scale-on-ibm-cloud/
関連情報:
インテル® Gaudi® 3 アクセラレーター
https://www.intel.co.jp/content/www/jp/ja/products/details/processors/ai-accelerators/gaudi.html
インテル® Xeon® プロセッサーとは?
https://www.intel.co.jp/content/www/jp/ja/data-center/what-is-xeon-processor.html
インテル エンタープライズ AI
https://www.intel.co.jp/content/www/jp/ja/products/docs/accelerator-engines/enterprise-ai.html
インテル® デベロッパー・ゾーン
https://www.intel.co.jp/content/www/jp/ja/developer/topic-technology/artificial-intelligence/overview.html