はじめに
IBM Cloud上のストレージである、COS(Cloud Object Storage)で便利なのにあまり知られていない機能の一つとしてAsperaによるファイル転送機能があります。これはブラウザ側にAspera用のプラグインを導入することにより、高速なファイル転送を実現する機能で、おそらくIBM Cloud独自の機能ではないかと思われます。
Watson Studio / Watson Knowledge Catalogでは、プロジェクト作成の際に、自動的にCOSのバケットが生成され、データアセットの登録はCOSに対して行われます。しかし、Watson Studio / Knowledge CatalogのUIを経由してしまうと、高速なAspera転送機能を利用できなくなります。
そこで、ファイルアップロード自体はCOS側のUIを使い、アップロード済みのファイルをKnowledge Catalog/Watson Studioで参照したいという要望が出てきます。この要望を実現するための手順について、当記事で説明を行います。
1. COS側の作業
最初にCOS側の準備作業を説明します。ここでは、
- バゲットの作成
- 資格情報の取得
- エンドポイントURLの取得
のすべての手順を説明します。それに対応済みのものがある場合、その手順はスキップしていただいて大丈夫です。
1-0 COS管理画面の表示
まずは、IBM CloudでCOS管理画面を表示させます。下のURLをクリックし、ユーザーID、パスワードを入力してログインしてください。
下のリソース一覧画面が表示されたら、cloud-object-storage-xx のリンクをクリックすると、COS管理画面になります。
1-1 バケットの作成
まだ、バケットを作成していない場合は、バケットの作成をします。(作成済みの場合はスキップして結構です)
COS管理画面左メニューから「バケット」をクリックします。更に右に出てくる「バケットの作成」のボタンをクリックします。
下の画面になったら、「バケットのカスタマイズ」の右下の矢印をクリックします。
下の画面では、最初にバケット名を入力します。バケット名はインターネット全体でユニークな必要があるので注意してください。このバケット名は、後ほど設定で必要になるので、エディタなどで保存しておいてください。
「回復力」はデフォルトのRegionalのままで結構です。
その下の「ロケーション」は、使いたいWatson Studioのインスタンスの近くを選びます。
画面の例ではStudioがus-southだったので、それの合わせた設定にしています。
これで設定はすべて終わりです。画面を一番下までスクロールさせて、「作成」ボタンをクリックしてください。
下のような画面になればバケット作成に成功しています。今作ったバケットのリンクをクリックして詳細画面を表示させます。
下の画面で何かテスト用のCSVファイルを一つアップロードしておいてください。
1-2 資格情報の取得
次に資格情報を取得する手順です。
下のCOS管理画面に戻り、左のメニューから「サービス資格情報」を選択します。
更に、右に出てくる「新規資格情報」のリンクをクリックします。
下のようなパネルが出てきます。ほとんどの項目はデフォルトでいいのですが、一点だけ「HMAC資格情報を含める」のスイッチをデフォルトのオフからオンに変えてください。
この設定ができたら、右下の「追加」ボタンをクリックします。
資格情報の一覧画面に戻るはずです。今作った資格情報の左の矢印アイコンをクリックして、中身を確認します。
「cos_hmac_keys」という項目ができているかどうかが重要です。確認できたら、画面右上のクリップボードアイコンをクリックします。これで、資格情報全体が、クリップボードにコピーされたはずなので、テキストエディタなどの貼り付けて、その結果を確認してください。
1-3 エンドポイントURLの取得
最後のステップは、エンドポイントURLの確認です。
COS管理メニューから「エンドポイント」を選択します。
「回復力」と「ロケーション」を先ほどバケットを作った設定と合わせます。
最後に「パブリック」の右下にあるクリップボードアイコンをクリックしてください。
この結果をテキストエディタに貼り付けます。更にエディタ上で、頭にhttps://
を付け加えるようにしてください。
これが、この後の設定で用いるURLになります。
2. 接続情報の作成
ここまでの準備ができれば、後は、Watson Studio / Watson Knowledge catalogで接続情報の設定をするだけです。以下の例ではCatalogの場合の画面を示しますが、Studioの場合も手順は同じになります。
画面右上のメニューから「カタログに追加」->「接続」を選びます。
下のような一覧が出てくるので、「Cloud Object Storage」(2つありますが、インフラストラクチャーのない、上の方)を選んでください。
下のような新規接続情報入力画面になるので、まず、一番左上の名称を入力してください。
次に真ん中の列の「接続の詳細」の項目を入力します。ここは重要なので、画面を別に示します。
入力が必要なのは、次の4項目です。
① アクセス・キー
資格情報のうち、"access_key_id"の値をダブルクオートを取った形で入力します。
② バケット
作成したバケット名です。上の手順の例だとaka-test-bucket-01
になります。
③ 秘密鍵
資格情報のうち、"secret_access_key"の値を、ダブルクオートを取った形で入力します。
④ ログインURL
1-3の手順で組み立てた(先頭にhttps://
を追加したもの)エンドポイントURLを入力して下さい。
すべての設定ができたら、画面右下の「テスト」のボタンをクリックします。
正しく設定できている場合、下のようなメッセージが画面上部に表示されるので、「テスト」の右の「作成」ボタンをクリックして、接続情報を保存してください。逆にテストの結果がうまくいかない場合、どこかの設定が違っているはずなので、先ほどの4カ所の項目が正しいか、見直してください。
3. その後の利用方法
ここまでのことができれば、後の使い方は簡単です。
例えば、接続情報をKnowledge Catalog側で設定した場合、この接続情報を個別プロジェクトにExportすることができます。
この場合、プロジェクト側では、「プロジェクトに追加」->「接続データ」により、実体がCOS Bucket上にあるCSVファイルを、コピーせずに利用することが可能となります。