インスタンスの作成
コレクションの作成
サンプルデータのアップロード
苦戦したこと、気になったこと
・いくつかの文章は取り込んだらエラーになった。
・縦書きの文章には対応していないらしい。取り込めるけど、以降のフィールドの識別が横書き仕様
→設定すればできるのかもしれないけど、デフォルトではできない。
・同じような形式の文章を取り込まないと、以降のフィールド設定が面倒
・サンプル数として、どのくらい取り込みが必要なのか不明
フィールドの設定
・左のPaneが原文で右がSDU(Smart Document Understanding)が認識したフィールド
・右のPaneのフィールドを一文ずつラベル付けしていく。
・ラベル付けはクリック、もしくはドラッグで。複数文章をラベル付けする際にはドラッグするのが速い。
・各ページごとにラベル付けをしてSubmitする。これを全ページする。
・サンプルに登録した全ファイル(今回は2つ)に同じ設定をする。
・2回目以降は、最初にラベル付けしたファイルを参考にWatsonが最初にラベル付けしてくれるので、設定は楽。
でも、間違ってるところはあるので、全部確認しないといけない。
フィールドの管理
この辺はよくわからなかったので、後で復習する。
インデックスとして使用するフィールドの選択
エンリッチの設定
ドキュメントの取り込み
画像取り忘れたけど、確か同じ操作でそのほかの取り込みたいドキュメントをアップロードする
→エラー出てるけど、とりあえず無視
検索(効果の確認)
自然言語での検索
DQLでの検索
集計結果の確認
まとめ
・コードを書かずにマウスでポチポチするだけでここまでできるのは便利。
・用意したドキュメント数が少なかったので、効果がよくわからないところもあった。
・同じようなドキュメントでもエラーになったりならなかったり。その調査はできてない。
・いろいろな形式のドキュメントを同じコレクションで扱えるといいけど、何か設定が必要なのか??
→取り込めるけど、フィールド設定とかに無理がある。