More than 1 year has passed since last update.

DatabricksAdvent Calendar 2022

MLflow2.0: MLflow1.xよりの重要な変更点、主要な機能の追加と改良

Posted at 2022-12-04

本書は自分の理解を含めてMLflow 2.0.1のリリースノートに基づいて作成したものです。正確な内容に関しては原文を参照ください。

MLflowの2.0.1バージョンは、エンドツーエンドのMLOpsワークフローの管理の簡素化、新機能の提供、production-readyのMLOps機能の拡張に焦点を当てた、大きなマイルストーンとなるリリースです。MLflow 2.0のDatabricks MLflow 2.0ブログ記事（Linux FoundationのオープンソースMLflow 2.0 ブログ記事）で、詳細な解説をご覧ください。

このリリースには、1.xAPIよりいくつかの重要な変更点、主要な機能の追加と改良が含まれています。

機能の追加と改良

MLflow Recipes

MLflow PipelinesをMLflow Recipesに改名しました。MLflow Recipesはデータサイエンティストが高品質のモデルを迅速に開発し、本番環境にデプロイするためのフレームワークです。詳細は、以下のビデオとドキュメントをご覧ください。

MLflow Recipesに分類モデル構築のサポートを追加しました。

回帰問題の場合、recipes-regression-templateをご使用ください。
分類問題の場合、recipes-classification-templateをご使用ください。

UI

実験UIで、ランのピン留めのサポートを追加しました。
実験UIの表示を簡素化し、メトリクス、パラメータ、タグのカスタマイズした表示を提供しました。
実験UIでランのフィルタリングとランのランキングを簡単化しました。

Tracking

モデルが参照するrequirementファイルをgetするようにmlflow.pyfunc.get_model_dependencies()を更新しました。

mlflow.pyfunc.get_model_dependencies(model_uri, format='pip')

mlflow.tensorflow.autolog()でKerasモデルのsave_formatを選択できるようにサポートします。

mlflow.tensorflow.autolog()のkeras_model_kwargs引数にsave_formatを'tf'あるいは'h5'を指定して、Kerasモデルのsave_model（save）メソッドに渡すことができるようになりました。

Models

mlflow.evaluate()が安定なproduction-ready APIになりました。

mlflow.evaluate(model: str, data, *, targets, model_type: str, dataset_path=None, feature_names: Optional[list] = None, evaluators=None, evaluator_config=None, custom_metrics=None, custom_artifacts=None, validation_thresholds=None, baseline_model=None, env_manager='local')

mlflow.evaluate()によるモデル評価時にカスタムメトリクスやカスタム成果物を指定するためのAPIを簡素化しました。

カスタマメトリクスの使用例：

import mlflow
import numpy as np

def root_mean_squared_error(eval_df, _builtin_metrics):
    return np.sqrt((np.abs(eval_df["prediction"] - eval_df["target"]) ** 2).mean)

rmse_metric = mlflow.models.make_metric(
    eval_fn=root_mean_squared_error,
    greater_is_better=False,
)
mlflow.evaluate(..., custom_metrics=[rmse_metric])

カスタム成果物の使用例：

import mlflow
import matplotlib.pyplot as plt

def scatter_plot(eval_df, builtin_metrics, artifacts_dir):
    plt.scatter(eval_df['prediction'], eval_df['target'])
    plt.xlabel('Targets')
    plt.ylabel('Predictions')
    plt.title("Targets vs. Predictions")
    plt.savefig(os.path.join(artifacts_dir, "example.png"))
    plt.close()
    return {"pred_target_scatter": os.path.join(artifacts_dir, "example.png")}

def pred_sample(eval_df, _builtin_metrics, _artifacts_dir):
    return {"pred_sample": pred_sample.head(10)}

mlflow.evaluate(..., custom_artifacts=[scatter_plot, pred_sample])

mlflow.evaluate()で二値分類モデルを評価する場合、正例ラベルを使用することになりました。
mlflow.tensorflow.autolog()が有効にするときにデフォルトでtensorflowとkerasモデルのsignatureの自動ロギングを有効になります。

mlflow.tensorflow.autolog(every_n_iter=1, log_models=True, disable=False, exclusive=False, disable_for_unsupported_versions=False, silent=False, registered_model_name=None, log_input_examples=False, log_model_signatures=True, saved_model_kwargs=None, keras_model_kwargs=None)

mlflow.tensorflowでKerasとTensorflowのネイティブのCoreモデルをサポートします。

mlflow.tensorflow.load_model(model_uri, dst_path=None, saved_model_kwargs=None, keras_model_kwargs=None)でtensorflow2コアモデルとKerasコアモデルをロードできるようになりました。

mlflow.xgboost.save_model()/log_model()でmodel_formatを定義するようになりました。

mlflow.xgboost.save_model(xgb_model, path, conda_env=None, code_paths=None, mlflow_model=None, signature: mlflow.models.signature.ModelSignature = None, input_example: Union[pandas.core.frame.DataFrame, numpy.ndarray, dict, list, csr_matrix, csc_matrix] = None, pip_requirements=None, extra_pip_requirements=None, model_format='xgb')

mlflow.xgboost.log_model(xgb_model, artifact_path, conda_env=None, code_paths=None, registered_model_name=None, signature: mlflow.models.signature.ModelSignature = None, input_example: Union[pandas.core.frame.DataFrame, numpy.ndarray, dict, list, csr_matrix, csc_matrix] = None, await_registration_for=300, pip_requirements=None, extra_pip_requirements=None, model_format=None, **kwargs)

Scoring

モデルスコアリングREST APIを改良し、入力にフォーマットのindicatorsを導入し、複数の出力フィールドをサポートします。

MLflow2.0: Classical Model ServingにおけるスコアリングAPIのアップデートをご参照ください。

モデルのSignatureに不規則配列（ragged array）をサポートします。

Java

JavaクライアントにgetModelVersionAPIを追加しました。

重要な変更点

以下の変更点リストは、各カテゴリーの中で重要度の高い順に並べたものです。

Core

Python 3.7 のサポートは終了しました。MLflow には Python >=3.8が必要です。

MLflow Recipes

mlflow.pipelinesのAPIはmlflow.recipesに置き換わりました。

Tracking / Registry

TrackingとModel RegistryのREST APIの/previewルートを削除しました。

Tracking

Python、Java、R、REST APIから実験、モデル、実行の非推奨のリストAPIを削除しました。

list_experiments()の代わりにsearch_experiments()を使用
list_run_infos()の代わりにsearch_runs()を使用
list_registered_models()の代わりにsearch_registered_models()を使用

Get Experiment REST APIのレスポンスから非推奨のrunsに関するレスポンスフィールドを削除しました。
非推奨のMlflowClient.download_artifactsAPIを削除しました。
MLFLOW_EXPERIMENT_NAMEに関する環境変数の取り扱いを変更し、実験作成時に常にその値が使用されるようにしました。

変更前:
環境変数のexperiment_nameまたはexperiment_idが追跡サーバーに存在しない場合は、デフォルトのexperiment_idを使用します。

変更後:
アクティブな実験が存在する場合は、その実験を使用します (環境変数を無視します)。
存在しない場合は：

環境変数でexperiment_nameが指定されている場合は、experiment_nameが追跡サーバーに存在することを確認します。experiment_nameが存在しないない場合は、例外が発生します。
experiment_nameとexperiment_idの両方が指定されている場合は、experiment_nameが追跡サーバーに登録されていること、および追跡サーバーからのexperiment_idが環境変数experiment_idと一致していることを確認します。そうでない場合は、例外が発生します。
experiment_idが指定されている場合は、追跡サーバーに登録されているかを検証します。登録されていない場合は、環境変数が問題の原因であることを説明するカスタム例外が発生します (experiment_idが見つからないという一般的な追跡サーバーの例外ではありません)。

mlflowサーバがデフォルトで--serve-artifactsモードで実行されるように更新しました。
スレッドセーフな並行処理を可能にするため、Filestoreバックエンドの実験 IDの生成を更新しました。

FileStore内のexperiment_idの生成を、スレッドセーフではない単調増加のidの値から、固定長のランダムなint64の値に変更しました。

mlflow.evaluate()のメトリックキーからdataset_nameとon_data_{name | hash}サフィックスを削除しました。

モデル/ Scoring / プロジェクト

モデルの推論とプロジェクトの実行において、デフォルトの環境マネージャーをcondaからvirtualenvに変更しました。

モデル環境を復元するときは、デフォルトでvirtualenvを使用します。
MLプロジェクトを実行するときは、デフォルトでvirtualenvを使用します。

Models

KerasのモデルロギングAPIをmlflow.tensorflowのフレーバーに移動し、TensorFlow Estimatorsのサポートを終了した。

mlflow.tensorflow.log_model(model, artifact_path, custom_objects=None, conda_env=None, code_paths=None, signature: mlflow.models.signature.ModelSignature = None, input_example: Union[pandas.core.frame.DataFrame, numpy.ndarray, dict, list, csr_matrix, csc_matrix] = None, registered_model_name=None, await_registration_for=300, pip_requirements=None, extra_pip_requirements=None, saved_model_kwargs=None, keras_model_kwargs=None)

非推奨のmlflow.sklearn.eval_and_log_metrics()APIを削除し、代わりにmlflow.evaluate()APIをサポートします。
mlflow.evaluate()のモデル入力にURIを指定することを必須となりました。
mlflow.evaluate()を使用したときに同じ関数からカスタムメトリックと成果物を返すサポートを終了し、custom_artifactsを使用するようになりました。
PyFuncModel仕様を拡張してcondaとvirtualenvのサブフィールドをサポートします。

Scoring

Content-Typeヘッダを使った入力フォーマットの定義のサポートを終了しました。
ネイティブサービングのCLIオプション引数 --no-condaを--env-manager='local'に置き換えました。
mlflow.sagemaker.deploy()とmlflow.sagemaker.delete()の公開APIを削除し、mlflow deployments -t sagemakerのようなMLflow deployments APIsを採用しました。

mlflow.sagemaker.deploy() & mlflow.sagemaker.delete() の代わりに、mlflow.deployments.get_deployment_client('sagemaker') (SageMakerDeploymentClient) を使用することになりました。

mlflow.deployments.predict()メソッドの入力引数dfをinputsにリネームしました。

abstractpredict(deployment_name=None, inputs=None, endpoint=None)[source]

Projects

MLflow Projectsの実行CLIコマンドのuse_conda引数をenv_manager引数に置き換えました。
MLflow Projectsのdockerイメージのビルドのオプションを変更し、--skip-image-buildを--build-imageに変更し、デフォルトをFalseにしました。

Integrations/Azure

非推奨のmlflow.azuremlモジュールをMLflowから削除し、azure-mlflowのデプロイメント・プラグインを採用しました。

参考：https://learn.microsoft.com/en-us/azure/machine-learning/how-to-deploy-mlflow-models?tabs=fromjob%2Cmir%2Ccli

R

Rクライアントとのcondaの統合を削除しました。

バグの修正

【Recipes】プロファイルカードポリフィル（profile cards polyfill）のレンダリングに関する問題を修正しました。
【トラッキング】MLflow.start_run()のtags引数にMLflow Run名を指定すると、正しく設定できました。
【Tracking】mlflow.runNameタグが設定されていて、MLflowのRun名の割り当てが競合する場合の問題を修正しました。
【Scoring】SageMakerデプロイメントのクライアントpredict()API の不正なペイロード・コンストラクタ・エラー（payload constructor error）を修正しました。
【Scoring】Sagemakerのデプロイメントを更新する際にDataCaptureConfigの情報が保存されない問題を修正しました。

詳細の変更点の一覧は、リリースの変更履歴を参照し、mlflow.orgの最新ドキュメントを確認ください。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up