MLflow Model Registry on Databricks | Databricks on AWS [2021/10/14時点]の翻訳です。
MLflowモデルレジストリは集中管理されたモデルリポジトリであり、MLflowモデルの完全なライフサイクルの管理を実現するためのUIと一連のAPIを提供します。モデルレジストリは、時系列のモデルリネージュ(特定の時点でどのMLflowエクスペリメント、ランがモデルを生成したのか)、モデルのバージョン管理、ステージ遷移(例えば、ステージングからプロダクション、アーカイブに)、モデルイベントにおけるメール通知といった機能を提供します。また、モデルの説明文やコメントを追加することができます。
モデルレジストリUIやモデルレジストリAPIを用いてモデルレジストリを操作することができます。このページには、モデルレジストリの概念的な情報、どのようにモデルレジストリを使うのかを説明するサンプルノートブックが含まれています。
モデルレジストリの利用手順に関しては、Databricksにおける機械学習モデルの管理をご覧ください。
モデルレジストリのコンセプト
-
モデル: エクスペリメントやランによって、モデルのフレーバーの
mlflow.<model-flavor>.log_model
メソッドで記録されるMLflowモデルです。記録されると、モデルをモデルレジストリに登録することができます。 - 登録モデル: モデルレジストリに登録されるMLflowモデルです。登録モデルは、ユニークな名称、バージョン、モデルリネージュ、その他のメタデータを持ちます。
- モデルバージョン: 登録モデルの1バージョンです。モデルレジストリに新規モデルが登録されると、バージョン1として追加されます。同じモデル名に登録されるそれぞれのモデルは、バージョン番号を増加させます。
- モデルステージ: モデルバージョンは1つ以上のステージに割り当てることができます。MLflowは一般的なユースケースに対応するNone、Staging、Production、Archivedのステージを事前に定義しています。適切なアクセス権を持っていれば、モデルバージョンをステージ間で遷移させるか、遷移をリクエストすることができます。
- 説明文: アルゴリズムの説明、使用したデータセット、方法論などチームにとって有用な情報、説明を含むモデルの意図を注釈することができます。
- アクティビティ: 登録されたそれぞれのモデルに対する、ステージ遷移のリクエストのようなアクティビティは記録されます。アクティビティの追跡によって、実験段階からステージング、プロダクションに至るモデルの進化におけるリネージュや監査可能性を提供します。
登録モデル一覧ページ
サイドバーのModelsをクリックすることで、登録モデル一覧ページが表示されます。このページでは、レジストリの全てのモデルが現在のステージ、最終更新時刻、タグ、サービング状況とともに表示されます。このページから新規モデルを作成することができます。
このページから、モデルレジストリの全てのモデルに対するアクセス権を設定することができます。
登録モデルページ
モデルの登録モデルページを表示するには、登録モデル一覧ページでモデル名をクリックします。登録モデルページでは、選択したモデルの情報、および、それぞれのモデルバージョンに関する情報を示すテーブルが表示されます。このページから、以下のことが可能となります。
モデルバージョンページ
モデルバージョンページを表示するには、以下のいずれかを実行します。
- 登録モデル一覧ページのLatest Versionのバージョン名をクリックします。
- 登録モデルページのVersionカラムのバージョン名をクリックします。
このページでは、登録モデルの特定バージョンに関する情報を表示し、ソースとなるラン(モデルを生成するために実行されたノートブックのバージョン)へのリンクを提供します。このページでは、以下のことを実行できます。
サンプル
風力発電における日次の出力電力を予測する機械学習アプリケーションを構築するために、どのようにモデルレジストリを使うのかを説明するサンプルに関しては、以下をご覧ください。