本記事はこちらのブログを参考にしています。
翻訳にはアリババクラウドのModelStudio(Qwen)を使用しております。
AIがもたらす新たな挑戦と機会:大規模モデル時代のAIによるOSサービス体験の全面的なアップグレード
著者: Xu Zhou
AIは新たな挑戦と共に新たな機会ももたらします。AIを活用することで、個別のオペレーティングシステムツールの機能を統一し、オペレーティングシステムの使用を簡素化し、管理上の課題を解決することができます。上記の課題に対応して、OpenAnolisコミュニティとアリババクラウドは、アップグレードされた一連のオペレーティングシステムサービスを発表しました。これにより、ユーザーは包括的なAI支援型オペレーティングシステムソリューションに簡単にアクセスできるようになります。2024年のApsara Conferenceで、アリババクラウドの製品エキスパートであるXu Zhouは、オペレーティングシステムのオープンソースセッションにおいて、「AI駆動:大規模モデル時代におけるAIによるオペレーティングシステムサービス体験の全面的なアップグレード」について共有しました。以下がその内容です。
過去30年間、Linuxオペレーティングシステムは、アーキテクチャインフラストラクチャの重要な構成要素として極めて重要な役割を果たし、広く利用されてきました。AIとクラウドの発展に伴い、オペレーティングシステムに対する要求も変化しています。それは、人工知能アプリケーションの高性能計算とデータ処理の要求を満たす必要があるからです。さらに、オペレーティングシステムの管理も課題となっています。
オペレーティングシステムのカーネル技術スタックは複雑であり、異なるプロセスでの問題が一連の問題を引き起こす可能性があります。一般的な企業にとって、O&M(運用と保守)やチューニングのシナリオでは大きな困難があります。クラウドネイティブとServerlessアーキテクチャの登場により、企業はビジネスに焦点を当てることが増え、オペレーティングシステムへの意識が徐々に低下しています。しかし、オペレーティングシステムに関連する問題は避けられません。市場には多くの管理ツールがあり、アリババクラウドが開発したツールも多く含まれています。これらはダブル11のようなイベントの要求に対応し、クラウド製品とユーザーにサービスを提供するために開発されました。一方では、これらのツールの導入、維持、学習にはコストがかかります。他方では、特定の垂直領域の問題に対応するように設計されており、多様な企業環境で遭遇する複雑さを効果的に統合することはできません。オペレーティングシステムの各アップグレードと変更は、選択、計画、テスト、検証という長いプロセスを経る必要があります。オペレーティングシステムの変更によってビジネス運営が影響を受けないことを保証することは、オペレーティングシステムの管理における課題の一つです。
これらの課題は、ユーザーがコアビジネス活動に真正に集中できるようにするためのより良いオペレーティングシステム管理サービスの必要性を生じさせています。AIは新たな挑戦と共に新たな機会ももたらします。AIを活用することで、個別のオペレーティングシステムツールの機能を統一し、オペレーティングシステムの使用を簡素化し、管理上の課題を解決することができます。AIをコア能力として、アリババクラウドはアップグレードされた一連のオペレーティングシステムサービスを発表しました。これまで数年間、クラウドでの大量のアプリケーションの精緻化とグループのダブル11ビジネスシーンを通じて、アリババクラウドはシステム管理の豊富な経験を積み、関連するツールセットを開発してきました。OpenAnolisコミュニティとの資源共有とともに、アリババクラウドはコミュニティのオープンソースプロジェクトと提携を通じて進化したツールとハードウェア-ソフトウェア協調能力にも恩恵を受けています。アリババクラウドでは、ユーザーはオペレーティングシステムコンソール、標準のOpenAPI、およびOS Copilotを通じて、包括的なスマートなAI支援型オペレーティングシステムソリューションに簡単にアクセスできます。
OS Copilot: AIが新しいOSユーザーエクスペリエンスの時代をもたらす
OS Copilotは、アリババクラウドがオペレーティングシステム分野のために開発したAIアシスタントです。そのコア機能には、コマンド補助実行、専門知識Q&A、スクリプト/コード生成、システムツール統合が含まれます。OS Copilotを使用すると、ユーザーはコマンドラインまたはターミナルコンソールを介して自然言語で指示を発行し、複雑なコマンドラインではなく、オペレーティングシステム上で一連の操作を完了することができます。単純なコマンド実行だけでなく、OS Copilotはツール機能を利用してさまざまなオペレーティングシステムシナリオをエンドツーエンドで完了することができます。特定のO&Mシナリオでは、ユーザーのO&M効率を少なくとも50%向上させることが証明されています。オペレーティングシステム分野での大規模モデルのコーパス訓練と調整を使用することで、OS Copilotは一般的な大規模モデルよりも正確なドメイン質問への回答性能を発揮します。
SysOM: システムヘルス、診断、およびプロセスホットスポット分析によるシステムO&M要件の簡素化
SysOMは、OpenAnolisコミュニティのシステムO&M SIGとアリババクラウドが共同で構築したオールインワンのオペレーティングシステムO&Mプラットフォームです。SIGメンバーの成功した商用O&M経験を取り入れることで、ユーザーは統一されたプラットフォームで複雑なオペレーティングシステムを管理できます。AIの発展に伴い、SysOMはAIインフラストラクチャ観測の領域を探索し、一連のスマートなデータ分析機能とO&Mエージェントを構築して、さらなる知能レベル、機能精度、データセキュリティ、体験の滑らかさ、サービス信頼性、コスト管理性を改善しています。SysOMはオペレーティングシステムの主要なO&Mコンポーネントであり、オペレーティングシステム管理の中心要素です。AIを活用して従来のメトリック収集、監視、アラートの方法を置き換え、代わりにシステムヘルスに焦点を当てることで、ユーザーがオペレーティングシステム全体の健康状態を感知できるようにします。このアプローチにより、問題の特定と包括的なシステム観測のためのエンドツーエンドのO&Mチェーンを作成できます。サーバーオペレーティングシステム環境では、システムの健康状態を適切に感知することは非常に困難です。一方では、メトリック収集が難しく、過剰なメトリックは高い保管コストとシステムパフォーマンスの低下を招きます。逆に、少ないメトリックは情報不足を引き起こし、問題の特定が困難になります。他方では、メトリックの分析も困難です。これらのメトリックを解釈し、それらの相互関係を理解するには、専門的なO&M経験が必要です。最後に、複雑なアーキテクチャでは