環境
Watson Discovery Premium on IBM Cloud(以下WD)
BOX
注意点
BOXの追加・更新された文書をWDに反映するには、BOXのアドミニストレータ権限でセットアップする必要がある
BOXのアカウントは2重認証を設定しておく必要がある
WDのBOXクロール設定では、クロール対象とするBOXのディレクトリを選択することができる
2021/05月時点、BOXにアップされたCSVの文書は、WDでは1行1文書としてクロールされるがCSVのヘッダーが認識されない(ContentMiningプロジェクトの場合WD側でファセットラベルを設定することはできる)
マニュアル
Configuring IBM Cloud data sources
https://cloud.ibm.com/docs/discovery-data?topic=discovery-data-sources#connectboxpublic
BOXの作業
1. BOXにログインしてDeveloper Consoleにアクセス
Developer Console
https://app.box.com/developers/console
2. 「アプリの新規作成」をクリック
3. 「カスタムアプリ」を選択
4. 「サーバー認証(JWT使用)」を選択してアプリ名を入力し、「アプリの作成」をクリック
5. 「構成」タブの「アプリアクセスレベル」で「アプリ+Enterpriseアクセス」を選択
BOXのアドミニストレータ権限がある場合にこの設定を選択
6. 「構成」タブの「高度な機能」のオプションを選択
BOXのアドミニストレータ権限がある場合にこのオプションをふたつとも選択
6. 「構成」タブの「公開キーの追加と管理」の設定
JSONファイルをダウンロードする
これらの値をWDのBOXクローラー設定の時に使用する
7. 「構成」タブの「変更を保存」をクリック
8. 「承認」タブの「確認して送信」をクリック
9. 承認リクエストのメールから承認処理を実施
以下のようなメールが届くので「アプリをレビュー」をクリック
下記ページに遷移するので「承認」をクリック
WDの作業
1. 管理画面からプロジェクトを作成
2. 接続先BOXの設定
BOXの作業手順 "6. 「構成」タブの「公開キーの追加と管理」の設定" で入手した値を入力
「Privage Key」欄には"-----BEGIN ENCRYPTED PRIVATE KEY-----"から"-----END ENCRYPTED PRIVATE KEY-----\n"までの値を入力する
3. 言語、クロール先ディレクトリを指定
「Finish」をクリックするとクロールとインデクシング処理が開始する