現在、本機能は廃止されています。
東京リージョンにWatson Studioを作成した場合、デフォルトで東京リージョンのバケットが利用されますので、本記事の手順実施は不要となりました。
現在は本記事の手順を実行することはできませんが、履歴として残しています。
製品資料:プロジェクトの作成
https://dataplatform.cloud.ibm.com/docs/content/wsj/getting-started/projects.html?context=analytics&audience=wdp&locale=ja
<抜粋>
新規プロジェクトが作成されると、 Cloud Object Storage バケットはデフォルトで Regional の回復力になります。 地域バケットは、同じ大都市圏内にある複数のデータ・センターにデータを分散します。
本記事の目的
IBM Cloud上で提供される Cloud Pak for Data as a Service の Watson Studio を利用される際、分析に使用するデータを日本国内に保持するという要件をお持ちのケースがあるかと思います。
本記事では、このようなケースで利用可能なオプション Regional project storage の有効化方法 をご紹介します。
このオプションを有効化すると、Watson Studioのプロジェクトで使用するデータの保存先を、単一の地理的な地域 に限定することができます。
- 東京リージョンのWatson Stuioを利用する場合、東京リージョンのみにデータを保存します。
Watson Studio プロジェクトにおけるデータ保存方法
Cloud Pak for Data as a Service(以降、CP4DaaSと表記)は、IBM Cloud上で提供されるマネージドな データ活用のプラットフォームです。IBM Cloud上の複数のサービスを組み合わせることで構成されています。このうち Watson Studio は、Cp4DaaSのコア・サービス*に位置付けられており、チームで協業して分析を行うための統合分析環境です。
*Watson Studio単独でもご利用いただけます。
Cloud Pak for Data as a Service の詳細につきましては、@Asuka_Saitoさんの下記記事をご参照ください。
IBM Cloud Pak for Data as a Serviceを始めてみる(1.プロビジョニング編)
Watson Studioでは プロジェクトという単位で、Jupyter Notebookなどの分析作業における作成物 やデータ等の資産を管理します。
プロジェクトの永続ストレージには、IBM Cloud Object Storage の バケット(Bucket) を使用します。
そのため、各種資産の実体はバケット上に保存されます。
Watson Studioのプロジェクト用のバケットのロケーションは、Watson Studio のサービスをプロビジョニングした地域に基づいて決定します。
デフォルトでは、Cross Region
(複数の地理的な地域へデータを保存する最も可用性が高い方式)のバケットとして作成されます。従って、複数の地域や国にデータが保存されます。
実際に デフォルト設定 と Regional project storage を有効化した状態 のそれぞれでWatson Stuioプロジェクトを作成し、バケットのロケーションを確認してみます。
1. デフォルト設定でのプロジェクト作成
Watson Studio を 東京リージョンに作成した場合、デフォルトでは Cross Region の ap-geo
のバケットが使用されます。
ap-geoの場合、アジア/太平洋地域の複数の地域にデータが保存されます。従って、日本以外の国にもデータが保存されます。
確認手順
- 東京リージョンのWatson Studioプロビジョン後、CP4DaaSへログインします。
- 特に設定変更をしていないデフォルトの状態で、プロジェクトを作成します。
- 作成されたプロジェクトの「管理」タブを開き、バケット名を確認します。その後、バケット名の下にある「IBM Cloudで管理」をクリックします。
- IBM Cloud Object Storage のUIより、プロジェクト名に対応するバケットのロケーションを確認します。
ap-geo
であることが確認できます。
確認例
-
東京リージョンのWatson Studioプロビジョン後、CP4DaaSへログインします。
-
作成されたプロジェクトの「管理」タブを開き、バケット名を確認します。その後、バケット名の下にある「IBM Cloudで管理」をクリックします。
-
IBM Cloud Object Storage のUIより、プロジェクト名に対応するバケットのロケーションを確認します。
ap-geo
であることが確認できます。
2. Regional project storage オプション の有効化
一方で、データを日本国内に留めるご要望がある場合など、Cross Regionのバケットが適さないケースがあるかと思います。
そのような場合、Regional project storage オプション を利用可能です。
製品資料:Force regional project storage ※Webブラウザの表示言語を英語にご変更ください
https://dataplatform.cloud.ibm.com/docs/content/wsj/admin/account-settings.html?context=analytics&audience=wdp#view-account-information
このオプションを使用すると、バケットの作成方法を Cross Region から Regional
(単一の地域内の複数のデータセンターへデータを保存する形式)へ変更することができます。
具体的には、Watson Studio のサービスをプロビジョニングした地域のバケットを使用します。
Watson Studio を 東京リージョンに作成した場合、Watson Studioのプロジェクト用のバケット作成先を、東京リージョンjp-tok
に限定することができます。
確認手順
- Cloud Pak for Data as a Serviceのメニューより、管理 >アカウントと請求 > アカウント に進みます。
- 画面をスクロールし、最下部にある Regional project storage を On に変更します。
- Regional project storage の設定変更は非同期に反映されますので、数分待ってから、後続のプロジェクト作成を実施します。
- 数分待った後、東京リージョンのWatson Studioにプロジェクトを作成します。
- 作成されたプロジェクトの「管理」タブを開き、バケット名を確認します。その後、バケット名の下にある「IBM Cloudで管理」をクリックします。
- IBM Cloud Object Storage のUIより、プロジェクト名に対応するバケットのロケーションを確認します。
jp-tok
に変更されたことが確認できます
確認例
-
Cloud Pak for Data as a Serviceのメニューより、管理 >アカウントと請求 > アカウント に進みます。
-
画面をスクロールし、最下部にある Regional project storage を On に変更します。
-
作成されたプロジェクトの「管理」タブを開き、バケット名を確認します。その後、バケット名の下にある「IBM Cloudで管理」をクリックします。
-
IBM Cloud Object Storage のUIより、プロジェクト名に対応するバケットのロケーションを確認します。
jp-tok
に変更されたことが確認できます
(ご参考)IBM Cloud Object Storage のレジリエンシー・オプション
Cross Region
と Regional
は、IBM Cloud Object Storage のレジリエンシー・オプションを表しています。
それぞれに特徴がありますが、Cross Region から Regionalに変更すると 遅延が小さくなりますので、データ読み書きの速度が向上します。
レジリエンシー・オプション | 説明 | 遅延 |
---|---|---|
Cross Region | 複数の地理的な地域へデータを保存する最も可用性が高い方式 | 数百ミリ秒 |
Regional | 単一の地理的な地域における複数データセンターへデータを保存する方式。Cross Regionよりもデータの遅延が小さい。 | 数十ミリ秒 |
レジリエンシー・オプションの詳細につきましては、製品ページをご覧ください。
IBM Cloud Object Storage グローバル・ロケーションとレジリエンシー・オプション
https://www.ibm.com/jp-ja/cloud/object-storage/resiliency