15
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Amazon SageMakerとAmazon FSx for NetApp ONTAPで実現する機械学習基盤 第3回

Posted at

はじめに

こんにちは。ネットアップ合同会社 Specialist SEの月岡です。
「Amazon SageMakerとAmazon FSx for NetApp ONTAPで実現する機械学習基盤」を全4回でお届けします。
第1回と第2回の記事はご覧になられましたでしょうか。
ご覧になられていない方は、是非ご覧ください。

やってみた

今回は、③ NetApp DataOps Toolkitをインストールし、NFS VolumeのSnapshot取得 / FlexCloneを作成をやってみたいと思います。

 ① Amazon FSx for NetApp ONTAPを作成し、Notebookインスタンス用のNFS Volumeを作成
 ② Notebookインスタンスを作成し、NFS Volumeをマウント
 ③ NetApp DataOps Toolkitをインストールし、NFS VolumeのSnapshot取得 / FlexCloneを作成
 ④ ライフサイクル設定により、再起動後もNFS Volumeの自動マウント / NetApp DataOps Toolkitの自動インストール
image.png

NetApp DataOps Toolkitとは

NetApp ONTAPを利用するストレージ向けに提供されるPythonライブラリです。
NetApp DataOps Toolkitを利用することで、データサイエンティストやデータエンジニア自身でネットアップストレージのVolume作成や複製、Snapshot取得などの処理を簡単に操作可能です。
GitHubに公開されていますので、どなたでも利用することが可能です。
https://github.com/NetApp/netapp-dataops-toolkit

NetApp DataOps Toolkitをインストールし、NFS VolumeのSnapshot取得 / FlexCloneを作成

Jupyter NotebookインスタンスにNetApp DataOps Toolkitをインストールする。

  • NetApp DataOps Toolkitをインストールする。(netapp-dataops-traditional)
    インストール方法や利用できるコマンドはGitHubに公開されています。
    https://github.com/NetApp/netapp-dataops-toolkit/tree/main/netapp_dataops_traditional
    image.png

  • NetApp DataOps Toolkitがインストールされたことを確認する。
    image.png

  • NetApp DataOps ToolkitのConfigを設定する。
    このとき、”ONTAP management LIF hostname or IP address” はストレージ仮想マシンの管理IPアドレス、 ONTAP API username / password はストレージ仮想マシンのユーザ (vsadmin) の指定を推奨
    image.png

NetApp DataOps Toolkitを使ったVolume操作をしてみる。

  • Amazon FSx for NetApp ONTAPのVolume一覧を取得してみる。
    image.png

  • NFS Volumeを複製してみる。(複製元:vol1、複製先:vol1_clone)
    image.png

  • 複製したVolumeをAmazon SageMakerのJupyter Notebookインスタンスにマウントしてみる。
    image.png

以上でNetApp DataOps Toolkitを利用し、Amazon FSx for NetApp ONTAP内のVolumeを操作できました。
Jupyter Notebookインスタンスを利用するエンジニア自身でデータセットやスクリプトが格納されたVolumeの複製やSnapshotによるバージョン管理が可能になります。

次回予告

いよいよ最終回です。
Amazon SageMakerのライフサイクル設定を投入し、実運用でも発生するJupyter Notebookインスタンスの再起動や作成を時のNFS Volumeの自動マウント / NetApp DataOps Toolkitの自動インストールができることを確認します。

主な参照元

15
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
15
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?