概要
Databricks にて Evidently という ML モデルのパフォーマンス監視ライブラリをとりあえず動かす方法を共有します。Evidently の Docs に記載されている Basic Example - Evidently Documentation (evidentlyai.com)をベースに実行する方法を提示します。
引用元:Evidently AI - Open-Source Machine Learning Monitoring
Issues に記載されていたのですが、Databricks 上で実行結果を表示する際にはmode
をinline
に設定する必要があるようです。
Basic Example の実行手順
%pip install evidently -q
import pandas as pd
from sklearn import datasets
from evidently.test_suite import TestSuite
from evidently.test_preset import DataStabilityTestPreset
from evidently.report import Report
from evidently.metric_preset import DataDriftPreset
iris_data = datasets.load_iris(as_frame='auto')
iris_frame = iris_data.frame
data_stability= TestSuite(tests=[
DataStabilityTestPreset(),
])
data_stability.run(current_data=iris_frame.iloc[:60], reference_data=iris_frame.iloc[60:], column_mapping=None)
data_stability.show(mode='inline')
data_drift_report = Report(metrics=[
DataDriftPreset(),
])
data_drift_report.run(current_data=iris_frame.iloc[:60], reference_data=iris_frame.iloc[60:], column_mapping=None)
data_drift_report.show(mode='inline')