はじめに
Watson サービスの中で R&R の SoIr 用の JSON データを、PDFファイルなどから変換してくれるサービスです。
以下を作業する前に、Bluemix 上で、NLC サービスをカタログから選択して、サービスを作成していることを前提とします。
変換方法
サービスを作成後、選択スト以下のような画面があるので、「Demo」を選択する。
「Upload a file」を選択すると、「Choose your file」を選択してファイルを指定する。但し、1MBのサイズまで。
サイズ制限があるので、サービスを確認する最初の画面から、「サービス資格情報」を選択し、クレデンシャル情報を確認して、以下のようにAPIを呼ぶことで、サイズ制限なく変換可能。
curl -X POST -u "{username}":"{password}" -F config="{"conversion_target":"answer_units"}" -F file=@{ファイル名} "https://gateway.watsonplatform.net/document-conversion/api/v1/convert_document?version=2015-12-15"
変換結果
手元にある適当なファイルを変換してみた。PDFにあるタイトルを title にして、content は、そのセンテンスの文章をいれている感じ。扱える文書は、限られる気がするが、簡易的にデータ作成した場合は活用できるかも。
あとがき
Document Conversation は、使い方も簡単だが、読み込ませるデータは考えなければいけないのと、出力データは整形スクリプトを書く必要がありそう。
参考
書籍: 初めてのWatson
変更履歴
2017/01/03 公開
2017/01/04 タイトルのミスを修正^^;