0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Watson Machine Learningでカスタム・イメージを利用する

Last updated at Posted at 2021-04-26

##はじめに
この記事では、IBM Watson Machine Learningが提供しているRuntimeイメージをベースに、新しいカスタム・イメージを作成する方法をご紹介します。
これによりデプロイメントに必要なパッケージが含まれたカスタムのイメージを作成し、Machine Learningの資産をデプロイできるようになります。
##環境

  • IBM Cloud Pak for Datab 3.5.2(Watson Machine Learning)
  • 作業マシン(Red Hat 7.8)

##カスタム・イメージの作成
こちらのマニュアル記述に沿って必要な構成を行います。
Watson Machine Learning のカスタム・イメージを使用したデプロイ
以下の手順を行います。詳しくは後述します。
image.png
            図1. カスタム・イメージの作成

1. ランタイム・イメージのダウンロード
2. ランタイム・イメージのカスタマイズ
3. カスタム・イメージのアップロード
4. ソフトウェア仕様を作成
5. ランタイム定義ファイルを作成
###1. ランタイム・イメージのダウンロード
以下を実行します。

POD=$(oc get pod -l name=cpd-install-operator -o=jsonpath='{.items[0].metadata.name}')
oc exec $POD -- helm  get values wml  -a --tls |  grep -A2  -B1 image | egrep -v '^-|image'  | sed -e 's/repository://' -e 's/tag://' | paste - - -

以下の例のような出力が現れますので自分がカスタマイズしたいものを選択します。

    wml-deployment-runtime-py37-1:v.0.1.40.51-amd64
    wml-deployment-runtime-py37-1:v.0.1.40.51-ppc64le
    wml-deployment-runtime-py37-1:v.352.0.1.40.51.10-amd64
    wml-deployment-runtime-py37-1:v.352.0.1.40.51.10-ppc64le
    wml-deployment-runtime-py37-1:v.353.0.1.40.51.1-amd64
    wml-deployment-runtime-py37-1:v.353.0.1.40.51.1-ppc64le

loginし、目的のイメージをPullします。

# podman login -u <username> -p <password> <image-registry-url>

以下、pullの実行例です。

#  podman pull <image-registry-host>/<name_space>/wml-deployment-runtime-py37-1:v.351.0.1.40.51.3-amd64

###2. ランタイム・イメージのカスタマイズ
カスタマイズするランタイムのイメージをダウンロードしたら、ダウンロードしたイメージをベースに新しいカスタム・イメージを作成できます。これを行うには、カスタマイズ内容をDockerfileに追加します。
####2-1. Dockerfileの編集
Dockerfileには追加構成したいpipパッケージを含めます。

ARG  base_image_tag
FROM ${base_image_tag}
RUN umask 002 \
 && pip install \
    <追加パッケージ>

####2-2. カスタム・イメージのビルド
新規イメージを作成します。
以下実行例です。ここではpodmanコマンドを利用し、--format dockerを指定しています。また、「イメージ名=wmlimagetest」、「タグ=04051545」を指定しました。カスタマイゼーションを含んだDockerfile./cp4dimagetest.wmlにて提供しました。

# podman build -t wmlimagetest:04051545 --format docker --build-arg base_image_tag=<your registry-URL>/wml-deployment-runtime-py37-1:v.351.0.1.40.51.3-amd64 -f cp4dimagetest.wml .

新しいイメージができました。

# podman images
REPOSITORY               TAG       IMAGE ID       CREATED         SIZE
localhost/wmlimagetest   04051545  7ee18f8fa5f5   2 minutes ago    5.82 GB

###3. カスタム・イメージのアップロード
イメージを作成したら、そのイメージをレジストリー・サーバーにプッシュして、イメージを登録する必要があります。
以下実行例です。

podman tag 7ee18f8fa5f5 <your registry-url>/wmlimagetest:04051545
podman push <image-registry-host>/<name space>/wmlimagetest:04051545

###4. ソフトウェア仕様を作成
カスタム・イメージを作成、登録、およびアップロードしたら、Watson Machine Learning のカスタム・イメージに指定したライブラリーとパッケージを使用できるように、カスタム・ソフトウェア仕様とランタイム定義ファイルを作成する必要があります。
まず、以下の手順でボリューム・サービスを作成し、そこに必要なファイルをアップロードします。

####4-1 アクセス・トークンの取得
以下を実行し、アクセス・トークンを取得します。

curl <CloudPakforData_URL>/v1/preauth/validateAuth -u <username>:<password>

####4-2 ボリューム・サービスの作成
取得したアクセス・トークンはTOKENにセットし、以下の例のようにボリューム・サービスを作成します。

VSNAME=CCHome
NAMESPACE=<namespace>

curl -k -X POST \
  $CPDHOST/zen-data/v3/service_instances \
  -H "Authorization: Bearer ${TOKEN}" \
  -H "Content-Type: application/json" \
  -d "{
        \"addon_type\": \"volumes\", \
        \"addon_version\": \"-\", \
        \"create_arguments\": { \
        \"metadata\": {
          \"existing_pvc_name\": \"cc-home-pvc\" \
        } \
        }, \
        \"namespace\": \"$NAMESPACE\", \
        \"display_name\": \"$VSNAME\" \
    }"

以下を実行して、正常に作成されたことを確認します。

curl -k \
    $CPDHOST/zen-data/v3/service_instances \
    -H "Authorization: Bearer ${TOKEN}" \
    -H 'Content-Type: application/json' | jq '.service_instances[] | .display_name,.id,.metadata.existing_pvc_name'

このファイル・サーバーを起動します。

curl -k -X POST \
  $CPDHOST/zen-data/v1/volumes/volume_services/$VSNAME \
  -H "Authorization: Bearer $TOKEN" \
  -H 'Content-Type: application/json' \
  -d '{}'

停止するには以下を実行します。次工程でソフトウェア仕様をアップロードするときにはまた起動してください。

curl -k -X DELETE \
  $CPDHOST/zen-data/v1/volumes/volume_services/$VSNAME \
  -H "Authorization: Bearer $TOKEN"

###4-3 ソフトウェア仕様の作成

ソフトウェア仕様をJSON形式で作成してアップロードします。
以下の例の様に変数をセットします。

SW_SPEC_NAME=demo-spec-1_py37
DISPLAY_NAME='test sw spec base 0.1.40-amd64'
SW_SPEC_JSON=${SW_SPEC_NAME}.json
PATH_SW_SPEC_JSON=`pwd`"/"$SW_SPEC_JSON

正常に変数がセットされたら、以下の例のようにソフトウェア仕様を作成します。

echo '{
  "metadata": {
 "name": "'"$SW_SPEC_NAME"'",
 "description": "Test"
  },
  "entity": {
 "software_specification": {
   "type": "base",
   "built_in": false,
   "package_extensions": [],
   "display_name": "'"$DISPLAY_NAME"'",
   "software_configuration": {
     "included_packages": [
       {
         "name": "scikit-learn",
         "version": "0.23"
       },
       {
         "name": "pytorch-onnx",
         "version": "1.3"
       },
       {
         "name": "tensorflow",
         "version": "2.1"
       },
       {
         "name": "gensim",
         "version": "3.8.0"
       }         
     ],
     "platform": {
       "name": "python",
       "version": "3.7"
     }
   }
 }
  }
}' > $SW_SPEC_JSON

上記の後、cat $SW_SPEC_JSONを実行し、正しくソフトウェア仕様を示すJSONが作られていることを確認してください。

####4-4 ソフトウェア仕様のアップロード
できたソフトウェア仕様をアップロードします。

curl -k -X PUT \
$CPDHOST/zen-volumes/$VSNAME/v1/volumes/files/%2F_global_%2Fconfig%2Fenvironments%2Fsoftware-specifications%2F$SW_SPEC_JSON \
-H "Authorization: Bearer $TOKEN" \
-H 'content-type: multipart/form-data' \
-F upFile=@"$PATH_SW_SPEC_JSON"

以下が表示されれば成功です。

{"_messageCode_":"Success","message":"Successfully uploaded file and created the necessary directory structure"}

####4-5 ソフトウェア仕様のダウンロード
前項でソフトウェア仕様が正常にアップロードされたことを確認します。実際に取得してみます。
以下を実行します。

curl -k -X GET \
$CPDHOST/zen-volumes/$VSNAME/v1/volumes/files/%2F_global_%2Fconfig%2Fenvironments%2Fsoftware-specifications%2F$SW_SPEC_JSON \
-H "Authorization: Bearer $TOKEN"

行ったカストマイゼーションの内容が反映されていることを確認します。

####4-6 ボリューム・サービスの再起動とソフトウェア仕様の確認
以下を実行してボリューム・サービスの再起動を行います。

curl -k -X DELETE \
$CPDHOST/zen-data/v1/volumes/volume_services/$VSNAME \
 -H "Authorization: Bearer $TOKEN"

curl -k -X POST \
$CPDHOST/zen-data/v1/volumes/volume_services/$VSNAME \
-H "Authorization: Bearer $TOKEN" \
-H 'Content-Type: application/json' \
-d '{}'

以下を実行しソフトウェア仕様を確認します。

curl -k -X GET \
    $CPDHOST/v2/software_specifications?name=$SW_SPEC_NAME \
    -H "Authorization: Bearer $TOKEN" | jq "."

以下の例の様な値が戻ります。

% Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100   727  100   727    0     0    580      0  0:00:01  0:00:01 --:--:--   580
{
  "total_results": 1,
  "resources": [
    {
      "metadata": {
        "created_at": "2021-04-05T08:05:04.658Z",
        "updated_at": "2021-04-05T08:05:04.658Z",
        "name": "demo-spec-1_py37",
        "description": "Test",
        "asset_type": "software_specification",
        "asset_id": "51301be2-ea21-5848-bb86-bdd86c4b893d",
        "href": "/v2/software_specifications/51301be2-ea21-5848-bb86-bdd86c4b893d"
      },
      "entity": {
        "software_specification": {
          "type": "base",
          "built_in": false,
          "package_extensions": [],
          "display_name": "test sw spec base 0.1.40-amd64",
          "software_configuration": {
            "included_packages": [
              {
                "name": "scikit-learn",
                "version": "0.23"
              },
              {
                "name": "pytorch-onnx",
                "version": "1.3"
              },
              {
                "name": "tensorflow",
                "version": "2.1"
              },
              {
                "name": "gensim",
                "version": "3.8.0"
              }
            ],
            "platform": {
              "name": "python",
              "version": "3.7"
            }
          }
        }
      }
    }
  ]
}

###5 ランタイム定義の作成
作成したソフトウェア仕様をWatson Machine Learningのイメージとマップするため、ランタイム定義ファイルを作成します。

####5-1 テンプレートの編集
以下の様なテンプレートがマニュユアルに提供されていますので必要な編集を行います。

# NOTE: The filename needs to end with *-server.json 
CUSTOM_WML_RUN_DEF=wml-$SW_SPEC_NAME-server.json

# template WML runtime definition
echo '{
    "displayName": "WML custom image sample",
    "description": "description for WML custom image sample RD",
    "author": "IBM",
    "tested": true,
    "isService": true,
    "features": ["wml"],
    "runtimeType": "wml",
    "software_specification_name": "sample-software-spec-name",
    "image": "image-registry.openshift-image-registry.svc:5000/ns21/wml-sample-image:test-1"
}' > $CUSTOM_WML_RUN_DEF

# replace the template with your values
tmp=$(mktemp)
jq  --arg dn "WML test" \
    --arg ds "WML description test" \
    --arg sw "${SW_SPEC_NAME}" \
    --arg img "${CUSTOM_IMAGE}" \
    '.displayName = $dn | .description = $ds | .software_specification_name = $sw | .image = $img' \
    $CUSTOM_WML_RUN_DEF > "$tmp" && mv "$tmp" $CUSTOM_WML_RUN_DEF

以下を実行し、意図通りの修正であることを確認します。

PATH_CUSTOM_RUN_DEF=`pwd`"/"$CUSTOM_WML_RUN_DEF
echo "Custom Runtime definition file path:"
echo $PATH_CUSTOM_RUN_DEF

echo "Content of the file:"
cat $CUSTOM_WML_RUN_DEF | jq "."

####5-2 ランタイム定義のアップロード
ランライム定義をアップロードします。以下を実行します。

curl -k -X PUT \
 $CPDHOST/zen-data/v1/volumes/files/%2F_global_%2Fconfig%2F.runtime-definitions%2Fibm \
 -H "Authorization: Bearer $TOKEN" \
 -H 'content-type: multipart/form-data' \
 -F upFile=@"$PATH_CUSTOM_RUN_DEF"

以下の様なメッセージが返ります。

{"_messageCode_":"Success","message":"Successfully uploaded file and created the necessary directory structure"}

####5-3 ランタイム定義がボリュームインスタンスにあることの確認
以下を実行し、ランタイム定義がボリュームインスタンスにあることの確認を行います。

curl -k -X GET  $CPDHOST/zen-data/v1/volumes/files/%2F_global_%2Fconfig%2F.runtime-definitions%2Fibm%2F$CUSTOM_WML_RUN_DEF  --header "Authorization: Bearer $TOKEN"

以下の例の様にカストマイズ・イメージの情報が得られます。

{
  "displayName": "WML test",
  "description": "WML description test",
  "author": "IBM",
  "tested": true,
  "isService": true,
  "features": [
    "wml"
  ],
  "runtimeType": "wml",
  "software_specification_name": "demo-spec-1_py37",
  "image": "<Image_url>/wmlimagetest:04051545"
}

####5-4 ランタイムイメージがRESTエンドポイントでもアクセスできることを確認
以下を実行します。

curl -k -s -X GET \
 $CPDHOST/v2/runtime_definitions \
 -H "Authorization: Bearer $TOKEN" 

これでカスタム・イメージを利用したモデルのデプロイができるようになりました。
##おわりに
今回示した手順により、必要なライブラリーやパッケージを追加したイメージをカスタム・イメージとして作成し、これをWatson Machine Learningで利用できる様になります。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?