ビジネスは、景気の浮き沈みを乗り越えながら進めていかなくてはなりません。こうした様々な状況に対応できるAI戦略を構築するには、本番環境でのモデルの展開、モニタリング、再トレーニングのためのシステムが必要です。戦略の転換や環境の変化に即座に対応するために、新しいモデルを迅速に導入、テスト、トレーニング、実装できることが重要となります。これが MLOpsです。あらためて、MLOpsを定義してみます。MLOpsとは何でしょうか?
MLOpsとは何か、なぜ必要なのか?
モデルベースの機械学習とAIは、すべての大企業で急速に主流になりつつあるテクノロジーです。そのメリットを最大限に享受するためには、モデルを本番稼動させる必要がありますが、それを大規模に実施すれば新たな課題が生じます。MLOpsを定義するには、既存のDevOpsやDataOpsの専門知識だけでは不十分だと理解する必要があります。
そこで、機械学習のライフサイクル管理の標準化と合理化である[MLOps}(https://www.dataiku.com/product/key-capabilities/mlops/)の出番です。MLOpsは、ライフサイクルから摩擦を取り除くことを目的としています。「MLOpsとは何か」という問いに対する答えは、単にDevOpsを機械学習に適用したもの、という単純なものにはなりません。実際に、機械学習のライフサイクルを大規模に管理することが困難である主な理由は3つあります:
1: DevOpsとは対照的に、AIツールの状況は非常に断片化されており、常に変化している。
2: AIを大規模に運用することはチームスポーツですが、すべての人が同じ言語を話すわけではない。3: 機械学習のライフサイクルには、ビジネス、データサイエンス、ITの各チームの人々が関わっている。しかし、それぞれのチームやメンバーは同じツールを使っておらず、同じ基本スキルを共有していない場合が多い。
(ほとんどの)データサイエンティストは、ソフトウェアエンジニアでもデータエンジニアでもない。ほとんどの場合、モデルの構築と評価に特化しており、モデルの展開と保守の専門家とは限らない。しかし、多くの場合、データサイエンティストが行っている。
効率的な機械学習運用の構築
強力な機械学習の運用を構築する機械学習モデルの管理プログラムは、次のような疑問に答えることを目的としています:
- モデルを開発・選択する際、どのようなパフォーマンス指標を測定するのか?モデルが堅牢で、バイアスがなく、安全であることをどのように確認するか?
- モデルの性能は、ビジネスでどのレベルまで許容可能か?
- 本番の機械学習モデルのパフォーマンスとメンテナンスに誰が責任を持つかを定義しているか?
- モデル・ドリフト(モデル性能の劣化)を考慮した機械学習モデルの更新はどのように行うのか?アラートが来たときに、モデルを簡単に再学習させることができるか?
- デプロイするモデルや機械学習プロジェクトの信頼性を高めるには?
- めまぐるしく変化するAI環境におけるビジネスニーズに対応するため、機械学習プロジェクトを迅速に展開するにはどうすればよいか?
- モデルの劣化や予期せぬ異常なデータや予測を検出するために、長期にわたってモデルをどのように監視するのか?
- モデルはどのように監査され、開発チーム以外の人にも説明できるようになっているか?
- AIのライフサイクルに沿って、モデルやプロジェクトをどのように文書化しているか?
これらの質問は、機械学習モデルのライフサイクルの範囲に及びます。これらの回答はデータサイエンティストだけでなく、企業全体の人々を巻き込むことになります。これは、MLOpsが単なるツールやテクニックの話ではないことを示しています。MLOpsとは、分断を取り払ってコラボレーションを促進することで、継続的で再現可能かつ摩擦のないAIライフサイクルを軸に、機械学習プロジェクトで、効果的なチームワークを可能にすることです。データサイエンスと機械学習を効率的に拡張し、Everyday AIを実現するだけでなく、ビジネスにリスクを与えない方法で行います。
適切なMLOpsプラクティスを実施せずにデータサイエンスを導入しようとするチームは、特に今日の予測不可能で前例がなく絶えず変化する環境において、モデルの品質と継続性の問題に直面するでしょう。また、MLOpsのプラクティスを導入していないチームは、品質の低下よりもさらに悪いことに、ビジネスに実際に悪影響を与えるモデル(例えば、偏った予測を行い、会社に悪い影響を与えるモデル)を導入してしまうリスクがあります。
MLOpsプロセスから摩擦を取り除く
MLOpsプロセスから摩擦を取り除き、モデルのプロセスを信頼し、アジャイルで統制されたものにし、最終的にモデルとアナリティクスからより多くの価値をより迅速に提供できるようにするにはどうすればよいでしょうか?この25分の動画でその方法を学べます。
原文: What Is MLOps?