More than 3 years have passed since last update.

クラウドAI by ナレコムAdvent Calendar 2021

@banana-877(吉田奈々)in

株式会社ナレッジコミュニケーション

Azure で ML Ops をやってみる～実践編～

Last updated at 2021-12-13Posted at 2021-12-11

はじめに

この記事は株式会社ナレッジコミュニケーションが運営する
クラウドAI by ナレコム Advent Calendar 2021 の12日目にあたる記事になります。

こんにちは！
前回のパートで、機械学習モデルを運用する上での課題と、MLOps の概念について触れました。

こちらの記事では、どのように Azure サービスを用いて MLOps を実践するのか、手順などをまとめていきたいと思います。

Azure で MLOps ライフサイクルを実践するためのベストプラクティス

下記の図の5点が、Azure サービスで優れた MLOps 基盤を作るためのベストプラクティスを示した図になります。

再利用できるパイプラインでモデルを作成する
- モデリングに利用するデータセットの選択、各種パラメータの設定などもひとまとめにして、モデル作成のプロセスをパイプライン化します。
モデル登録の自動化
- イベント駆動型で本番稼働するモデルを変えられるように、メタ情報も含めてモデルのバージョン管理を行います。
監査証左の自動化
- テストコードも含めてパイプラインで一元管理します。
モニタリングをともなうデプロイ
- 機械学習モデルの再トレーニングのタイミングを見極めるために重要になっていきます。
データドリフトの検知
- ドリフトに周期性がみられる場合にはスケジュールベースでのリモデルも考えられますが、基本的にはドリフトの状況を見て再トレーニングを行います。

今回利用する GitHub リポジトリ

今回利用する Github リポジトリは以下の URL です。

実践編

今回実装するアーキテクチャ図

今回実装する範囲は、以下のアーキテクチャ図の赤枠部分になります。
次項から、実装に移りたいと思います。

Azure Pipelineの設定　

Azure Pipeline設定

Azure Machine Learningとインフラ環境を構築していきます。
以下のアーキテクチャ図の赤枠部分を構成していきます。

今回のメイン作業スペース、Azure DevOps を開きます。

Azure DevOps 左サイドメニューから Pipelines をクリックします。
今回は大きく分けて3つのパイプラインを構築していきます。

1つ目のパイプライン AML-Iac
Azure Machine Learningを含めた　インフラ環境を構築するためのパイプライン
2つ目のパイプライン Model Train Register CI
機械学習モデルの作成・及び登録を行うようなパイプライン
3つ目のパイプライン Model Deploy CD
Container Instance 、AKS にデプロイするような CD のパイプライン

フォークしたリポジトリ

GitHubからリポジトリをフォークします。
フォークしたリポジトリはAzure DevOpsのReposから確認できます。

各パイプラインは、例えばモデルの作成を開くと、
diabetes_regression-ci.yml
モデル実行時に利用するような python のスクリプト、
下の階層で利用するような YAML が定義されています。

変数定義

次に、パイプライン上の変数を設定して行きます。

Pipelines > Library と進みまして、変数のグループを作成します。

下記画面から、変数名と各種変数を設定します。

今回追加した変数は9個です。

ACI_DEPLOYMENT_NAME / AKS_DEPLOYMENT_NAME
- これらはそれぞれ ACI と AKS のデプロイの名称になっています。
AKS_COMPUTER_NAME
- 推論クラスターの名称で、こちらは Azure Machine Learning側で設定します。
Azure_RM_SVC_CONNECTION
- こちらは、Azure パイプラインが Azure Resource Manager を介して、Azure Machine Learning ワークスペースと関連リソースを作成するための接続線です。
BASE_NAME
- リソースに名前をつけるためのプレフィックスになっています。
LOCATION
- Azure Devops のリソースロケーションを設定しています。
RESOURCE_GROUP
- 新規作成するAzure Machine Learning のリソースグループ名を定義しています。
WORKSPACE_NAME
- 作成するAzure Machine Learning のワークスペース名を定義しています。
WORKSPACE_SVC_CONNECTION
- こちらは、Azure パイプラインが　Azure Machine Learning ワークスペースとの接続を行うためのコネクションです。

変数の追加が終わりましたら、次にコネクションを作成していきます。

ワークスペース用　コネクションの作成

Azure DevOpsからAzure Machine Learning ワークスペースの展開用のコネクションを作成します。

Project Settings > サービスコネクションをクリックします。
- Connection Type には Azure Resource Manager を選択します。
- 認証方式については、デフォルトのサービスプリンシパルにしておきます。今回はスコープレベルはサブスクリプションとしまして、Resource Group はブランクのままで行います。
- サービスコネクションネームについては、先ほど変数のところで設定したazure-rm-csv-connection　パラメーターを入れます。

こちらで保存していただくと設定が完了です。

Azure Machine Learningとインフラ環境を構築するためのパイプライン構成

Azure Machine Learning とその周辺サービスのインフラを展開するパイプラインを実装していきます。

Pipelines から新規作成をします。
今回利用する YAML ファイルが保存されているReposGitを選択します。
Pipelines > New Pipelines > Azure Repos Git

複数のタイプからパイプラインを選べますが、
今回は existing Azure Pipeline YAML ファイルを選択します。

こちらはインフラの展開用の YAML ファイルを選択し、Countine をクリックします。> こちらのYAML ファイルが選択されますので、この状態で問題なければ、Run をクリックします。

パイプライン実行完了

パイプラインの実行が完了しますとこちらの画面に遷移します。
ジョブを選択しますと、それぞれの工程の実行履歴がこちらに出力されます。
エラーが起こった場合には、ジョブからエラーコードを確認できます。実際にはこちらのエラーコードを見て対処しつつ、パイプラインの実装を進めていくと言う形になります。

実装確認

実際に展開されたリソースグループを見てみますと、Application Insight、コンテナレジストリ、ストレージ、Azure ML ワークスペースと、
これらを連携するための Key Vault が作成されていることが分かります。
こちらでAzure Pipelinesの設定が完了しました。

1つ目のパイプライン構成　Azure Machine Learning (AML) Model Training CI パイプライン構成

以下のアーキテクチャ図の赤枠部分を構成していきます。

機械学習モデルの作成・及び登録を行うようなパイプライン構成をします。
Azure DevOps コンソールで作業を進める前に、Azure ML のパイプラインを Azure Pipeline から実行できるようにするエクステンションを入れる必要があります。

Azure Machine Learning 拡張機能を Azure DevOps にインストール

このURLからAzure Machine Learning 拡張機能を Azure DevOps にインストールできます。

拡張機能をインストールする DevOps Organizations を選択し、今回はインストール済みとなっていますが、インストールをクリックします。

Azure Machine Learning ワークスペースとの接続

次に、Azure Machine Learning ワークスペースとの接続を構成して行きます
Project Setting > サービスコネクション >
先ほどと同様に Azure Resource マネージャーサービスプリンシパルを選択、設定します。

今度はスコープレベルを Machine Learningワークスペースにします。
そして最初のパイプラインで作成した Resource Group、およびワークスペースを選択し、Services Connection Name には、ライブラリで定義した変数　ws-csv-connection のパラメーターを入れ、セーブをします。
これでコネクションの設定は完了です。

機械学習モデルの CI パイプライン実装

以上の構成で Azure Resource のセットアップやサービス接続の構成が完了しましたので、機械学習モデルの CI パイプラインを実装します。

パイプラインから新規作成をクリック、こちらも先ほどの Azure Machine Learning とその周辺サービスのインフラを展開するパイプライン構築と同じように Azure Repos の対象のリポジトリを選択し、Azure Pipeline YAML ファイルを選択します。
そして CI パイプラインの定義がされている YAML を選択しパイプラインの実行をします。

パイプラインの実行が完了

先ほどの Azure Machine Learning とその周辺サービスのインフラを展開するパイプライン構築と同じように Job からログを確認できます

アーティファクトをクリックしますと、

実際のパイプラインの成果物をこちらで確認することができます。

そしてこの後構築する CD パイプラインにおいて、
今回実行したパイプラインの名称を参照しますので、
こちらで Model-Train-Register-CI に名前を変更しておきます。

Azure Machine Learning ワークスペースに移動で、先ほど作成したパイプラインの結果を確認できます。

2つ目のパイプライン実装 Azure Container Instance (ACI) CD パイプライン構成

Azure Container Instance への CD パイプラインを実装します。

こちらのアーキテクチャ図のこちらの部分を構成していきます

CIパイプラインで作成したアーティファクトを用いて、Azure Container Instance にデプロイするパイプラインを実行します。

パイプライン > 先ほどのパイプライン構築と同じ手順で、Azure Container Instance への CD パイプラインを構築します。

Azure Repos の対象のリポジトリを選択し、
Azure Pipeline YAML ファイルを選択します。
今回は Regression-cd という YAMLファイルを選択します。
こちらでコンティニューを押すと、パイプラインが実行されます。