LoginSignup
2
0

More than 3 years have passed since last update.

Watson DiscoveryのBOXクロール方法

Posted at

環境

Watson Discovery Premium on IBM Cloud(以下WD)
BOX

注意点

BOXの追加・更新された文書をWDに反映するには、BOXのアドミニストレータ権限でセットアップする必要がある
BOXのアカウントは2重認証を設定しておく必要がある
WDのBOXクロール設定では、クロール対象とするBOXのディレクトリを選択することができる
2021/05月時点、BOXにアップされたCSVの文書は、WDでは1行1文書としてクロールされるがCSVのヘッダーが認識されない(ContentMiningプロジェクトの場合WD側でファセットラベルを設定することはできる)

マニュアル

Configuring IBM Cloud data sources
https://cloud.ibm.com/docs/discovery-data?topic=discovery-data-sources#connectboxpublic

BOXの作業

1. BOXにログインしてDeveloper Consoleにアクセス

Developer Console
https://app.box.com/developers/console

2. 「アプリの新規作成」をクリック

image.png

3. 「カスタムアプリ」を選択

image.png

4. 「サーバー認証(JWT使用)」を選択してアプリ名を入力し、「アプリの作成」をクリック

image.png

5. 「構成」タブの「アプリアクセスレベル」で「アプリ+Enterpriseアクセス」を選択

BOXのアドミニストレータ権限がある場合にこの設定を選択

image.png

6. 「構成」タブの「高度な機能」のオプションを選択

BOXのアドミニストレータ権限がある場合にこのオプションをふたつとも選択
image.png

6. 「構成」タブの「公開キーの追加と管理」の設定

「公開/秘密キーペアを生成」をクリック
image.png

2段階認証が求められるので、認証コードを入力
image.png

JSONファイルをダウンロードする
これらの値をWDのBOXクローラー設定の時に使用する
image.png

7. 「構成」タブの「変更を保存」をクリック

8. 「承認」タブの「確認して送信」をクリック

image.png

「アプリの説明」を入力して「送信」をクリック
image.png

「承認ステータス」が表示される
image.png

9. 承認リクエストのメールから承認処理を実施

以下のようなメールが届くので「アプリをレビュー」をクリック
image.png
下記ページに遷移するので「承認」をクリック
image.png

「承認」タブで「有効」になったこと確認できる
image.png

WDの作業

1. 管理画面からプロジェクトを作成

BOXを選択して「Next」をクリック
image.png

2. 接続先BOXの設定

BOXの作業手順 "6. 「構成」タブの「公開キーの追加と管理」の設定" で入手した値を入力
「Privage Key」欄には"-----BEGIN ENCRYPTED PRIVATE KEY-----"から"-----END ENCRYPTED PRIVATE KEY-----\n"までの値を入力する
image.png

3. 言語、クロール先ディレクトリを指定

image.png

「Finish」をクリックするとクロールとインデクシング処理が開始する

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0