このブログ記事では、大規模コンテナの必要性と導入戦略を評価するための4つのステップを紹介しています。
クラウドネイティブテクノロジーの発展に伴い、多くの企業が従来のITインフラをクラウドに移行し始めており、企業が競争力を維持するためには避けて通れないトレンドとなっています。さらに、パンデミックが進行する中、消費者の習慣の大きな変化を目の当たりにし、オンライン教育、オーディオ・ビデオ、公衆衛生などの業界が大きな成長を遂げています。多くの企業は、この時代の急速なビジネス成長の機会を捉え、クラウドコンピューティングやコンテナ技術を活用することで、飛躍的な発展を実現しています。最もよく知られ、広く採用されているクラウドネイティブテクノロジーの1つであるコンテナテクノロジーは、企業がITアーキテクチャのアジリティを向上させ、アプリケーションイノベーションを加速させ、ビジネス展開における不確実性に柔軟に対処するのに役立ちます。
大規模なコンテナ導入は企業にとって必須である
企業のデジタル化の進展は、流行によって加速しています。企業の日常業務では、低レイテンシー、高カレンシーのオンラインシナリオが頻繁に登場します。さらに、ビジネス革新への要求から、企業は新興技術を継続的に使用することを余儀なくされています。現在、Kubernetesは徐々にクラウドネイティブ時代のインフラとなっており、コンテナ技術はAI、ビッグデータ、ブロックチェーン、エッジコンピューティングなどのシナリオで広く使用されています。軽量なコンピューティングキャリアとして、コンテナ技術はより多くのシナリオに高い弾力性と敏捷性を提供します。日常業務やビジネス革新のプレッシャーの中で、より多くの企業が、ビジネスの健全かつ長期的な発展を確保するために、大規模なコンテナ展開を試験的に取り入れようとしています。
China Academy of Information and Communication Technology(CAICT)が発表した「China Cloud Native User Survey Report 2020」によると、60%以上のユーザーが生産現場でコンテナ技術を適用しています。また、80%近くのユーザーが生産ニーズを満たすために1,000以上のノードサイズを必要としており、13%以上のユーザーが5,000以上のノードを持つコンテナを持っており、9%が10,000以上のノードを持っているとのことです。クラウドネイティブ技術のさらなる普及に伴い、より多くの企業が自社のコアビジネスをコンテナに展開しています。企業の本番環境におけるコンテナ・クラスターの規模が爆発的な成長傾向を示していることから、コンテナの大規模展開は企業の「必修科目」となっています。現在、オープンソースのKubernetesは、最大で5,000ノード、15万ポッドをサポートしていますが、増大するビジネスニーズに対応できなくなってきています。
大規模なコンテナ展開の難しさ
大規模なコンテナクラスタは、より効率的なクラスタ管理により、サービスの負荷やトラフィックのバーストに大きな力を発揮します。クラウドネイティブ分野の実践者でありリーダーでもあるAlibaba Cloudは、1つのクラスターで1万ノード、100万ポッドの規模を達成することでリードしています。コミュニティKubernetesと比較すると、1つのクラスター内のノード数は2倍、ポッド数は6.7倍に増加しています。Alibaba Cloudは、数百万人のお客様にサービスを提供してきた経験に基づき、「大規模なコンテナ展開のための4ステップメソッド」を開発しました。この方法により、Alibaba Cloudは企業がデプロイメントの困難を克服し、増大するスケール需要に容易に対応できるようになります。ここでは、実際の状況に基づいてアドバイスを適用しやすくするために、質問の形でこの4つのステップを取り上げます。
ステップ1:企業は大規模なコンテナクラスターが必要か?
トラフィックの急増、複雑なコンピューティング、O&M効率のさらなる向上などのビジネスやIT需要に直面している企業にとって、単一のクラスタの容量は現在の開発のボトルネックとなっています。例えば、遺伝子解析やオンライン・フラッシュセールなどのビジネスでは、短時間で大きな負荷が発生するため、単一のクラスターのコンピューティング・リソース容量では厳しい状況になります。ポッドを一括して実行するための多数のノードをサポートできる単一クラスタが緊急に必要とされています。そのため、企業はクラスターの拡張を検討しようとしています。しかし、クラスターの規模を追求することは、完璧な方法ではありません。企業は、自社のビジネス展開の特徴に基づいて、ビジネス価値を実現するためにクラスタ機能を最適化する必要があります。やみくもにクラスターの大規模化を追求しても、障害や最適でないパフォーマンスのリスクが高まるだけです。
ステップ2: 複雑なコンテナスケーリング。システム全体を最適化するには?
クラウドネイティブ時代のOSであるKubernetes自体や、導入したクラウド環境は非常に複雑で途方もないものです。そのため、コンテナのスケーリングとは、基盤となるクラウドリソースから上位層のアプリケーションまで、システム全体の最適化を指します。企業は、最適化のために3つの側面に注目する必要があります。1つ目は、クラウド製品レベルでのクラウドリソースクォータの制限を解除すること、2つ目は、クラスター・コンポーネント・レベルでのリソース・スケールの改善、3つ目は、Kubernetesリソースレベルでのクラスタ構成ポリシーを最適化し、大規模なリソースを確保することです。
ステップ3:大規模なコンテナ展開後に元の性能を確保するのは難しい。さらにパフォーマンスを向上させるには?
コンテナクラスタを何倍もの規模にスケールアップした後は、ストレージ、クラスタネットワーク、アプリケーションディストリビューションに大きな課題が課せられます。例えば、大規模クラスター・データセンターのネットワーク・トラフィックは比較的大きいため、ネットワークのレイテンシーやジッターの問題も大きくなります。そのため、クラスター・ネットワークの伝送効率や安定性に影響が出てきます。もう一つの例は、大規模クラスターにおいてアプリケーションが一括して公開・更新される従来のシナリオです。10,000ノードの画像を瞬時に引き上げると、ネットワークに大きな影響を与え、画像サービスやネットワーク帯域に大きな影響を与えます。大規模なコンテナ展開は、強力な技術サポートを提供することを目的としており、本来のパフォーマンスを保証するだけでなく、全体のパフォーマンスをさらに向上させることができます。企業のお客様は、ノードとポッドのスケーリング効率、スループットとレイテンシーを含むネットワーク効率、DNSの解決効率、イメージの高速化という4つの側面からパフォーマンスを最適化することができます。
ステップ4:大規模コンテナ展開の「安定性」を確保するには?
大規模なクラスタ展開が最初の困難なステップだとすると、数万ノードのクラスタを安定的に運用することはさらに困難です。大規模システムにとって最も重要なことは、フォールトドメインを制御して崩壊を防ぐことです。コンテナのスケールよりも、スケールアップ後の安定性の方が重要です。大規模クラスターの復旧は、単純に再起動するだけではできないからです。崩壊が起きれば、全体のクラッシュは避けられず、事業継続に深刻な影響を与えます。企業にとって、大規模クラスターの安定性は、オンラインビジネスの安全性につながります。そのため、企業は事前に予期せぬ事態に備えてプランを検討するとともに、リソースインデックスやシステムコンポーネントの最適化を行う必要があります。さらに、すべてのノードを監視し、いつでも自己修復プロセスを開始できるようにする必要があります。
Alibaba Cloudが企業のオールインワンの大規模コンテナ展開を支援
企業における大規模なクラスター展開の課題に対処するために、Alibaba CloudはACK Proをベースにしたエンタープライズレベルのコンテナクラスター管理を提供します。また、APIサーバーやスケジューラーにさまざまなパフォーマンスの最適化を施し、リソース規模の制限をなくし、パフォーマンスを向上させ、クラスターの安定性を確保します。独自の高性能コンテナネットワークであるTerwayを使用することで、Podのレイテンシーを30%最適化し、大規模サービスのパフォーマンスオーバーヘッドを削減しています。これらの製品・サービスにより、大規模クラスターのネットワークのボトルネックを解消することができます。クラウドネイティブなネットワーク性能が提供されることで、クラスターのレスポンスを高速化することができます。また、エンタープライズレベルの画像レポジトリであるACR EEは、排他的ストレージをサポートし、必要に応じて画像をロードする機能を提供し、ブースト時間を60%削減します。これにより、大規模ノードの画像取り込みが遅いという問題を解決できます。Alibaba Cloudのストレージ、ネットワーク、セキュリティの機能を統合することで、大規模なコンテナ運用に最適なパフォーマンスをワンストップで提供します。企業のお客様は、より効率的なネットワーク転送、よりスケーラブルなストレージ、より効率的なアプリケーションとイメージの配信、より安定した安全な大規模クラスター管理を享受することができます。
なお、Cloud Native Industry Conference(CNIC)2020において、Alibaba CloudはCAICTが実施した大規模コンテナ性能試験に合格した最初のクラウドサービスベンダーとなりました。このテストでは、Alibaba Cloudは最高レベルの認証を取得しています。Alibaba Cloud Container Serviceの評価結果は、フルロードストレステスト、ネットワークレイテンシー、ネットワークパフォーマンスペナルティなどの多くの項目で、関係するすべてのベンダーの中で大きくリードしています。
つまり、Alibaba Cloudは十分な弾力性を持った「サービス能力空間」を持っていると言えます。コンテナクラスターサービスは、企業のビジネスボリュームに応じて、その時々のニーズに合わせてカスタマイズすることができます。Alibaba Cloudでは、Alibaba Cloudの製品や、Alibaba Groupの社内基幹システムのクラウドへのコンテナ移行をサポートしています。これらに加えて、Alibaba Cloudは、長年にわたる大規模なコンテナ技術を持つ製品を、W11(独身の日)に参加した多くのエコロジー企業や独立系ソフトウェアベンダー(ISV)に提供しています。世界中のさまざまな業界のクラウドコンテナをサポートすることで、Alibaba Cloud Container Serviceは、クラウドネイティブアプリケーションホスティングのためのミドルプラットフォームを構築し、ユニット化、グローバル化、および柔軟なアーキテクチャをサポートしています。さらに、コンテナサービスは10,000以上のコンテナクラスターを管理し、企業に信頼性の高いサービスを提供しています。
Alibaba Cloudは、中国で最大のコンテナクラスター、最も変化に富んだクラウドネイティブ製品群、そして最も包括的なオープンソースの実績を持っています。ECS Bare Metal Instance、PolarDB-X、AnalyticDB、Data Lake Formation(DLF)、Container Service、Microservices、DevOps、Serverlessなど、100種類以上の革新的な製品を、新しい小売業、政府、医療、交通、教育などのさまざまな分野で提供しています。Alibaba Cloudは、ガートナーの2019年および2020年のCompetitive Landscapeに含まれている中国で唯一のベンダーです。「Public Cloud Container Services」に含まれています。Alibaba Cloudは、サーバーレスKubernetes、サービスメッシュ、コンテナイメージなど9つの機能を提供し、Amazon Web Services(AWS)と並び、製品の多様性ではGoogle、Microsoft、IBM、Oracleに先行しています。
コンテナ技術の普及に伴い、コンテナの性能評価が産業界の大きな課題となっています。業界の悩みを解決するために、CAICTは、コンテナクラスタのコンポーネントレベルの性能を客観的かつ真に反映した、業界初の超大規模コンテナの性能試験結果を発表しました。CNIC 2020において、Alibaba Cloudの研究者であり、Alibaba Cloud native technologiesのディレクターであるDing Yu氏は、「Alibaba Cloudは、中国におけるクラウドネイティブの普及促進に常に尽力してきました」と述べています。Alibaba CloudはCAICTと協力して、中国におけるコンテナ市場の正常化・標準化された発展を推進していきます。
本ブログは英語版からの翻訳です。オリジナルはこちらからご確認いただけます。一部機械翻訳を使用しております。翻訳の間違いがありましたら、ご指摘いただけると幸いです。
アリババクラウドは日本に2つのデータセンターを有し、世界で60を超えるアベラビリティーゾーンを有するアジア太平洋地域No.1(2019ガートナー)のクラウドインフラ事業者です。
アリババクラウドの詳細は、こちらからご覧ください。
アリババクラウドジャパン公式ページ
