Edited at

Watson StudioでNLC学習を行う

More than 1 year has passed since last update.


はじめに

Watson StudioでNLCの学習をどうするか質問されたので、その手順をメモします。


事前準備

Watson Studioセットアップガイド(ライトアカウント可)でWatson Studioのワークスペース作成までを行います。

更にこの手順書の「オプション」にあるのと同様の手順でNLCサービスの登録、連携を行います。

Watson Studio自体はライトアカウントで可能ですが、NLCはLiteプランがなく、Standardプランは登録するだけで(一切利用しなくても)月20ドル(約2000円)かかる点はご注意下さい。

登録が終わった後の、Watson Studio Project Settingsの画面は次のようになります。

スクリーンショット 2018-08-30 19.22.36.png


CSVファイルの用意

学習に利用するCSVファイルを用意します。

CSVファイルは、従来と同様の "例文","クラス名"の形式です。

文字コードはUTF-8にして下さい。

以下に、学習データ例の一部を添付します。

"しおるるは 何かあんずの 花の色","spring"

"山路来て 何やらゆかし すみれ草","spring"
"長持に 春ぞくれ行く 更衣","summer"
"目には青葉 山ほととぎす はつがつを","summer"
"この道や 行くひとなしに 秋の暮れ","autumn"
"枯れ枝に 烏のとまりけり 秋の暮れ","autumn"
"初時雨 猿も小蓑を 欲しげなり","winter"
"いざ子ども はしりありかん 玉霰","winter"

(このデータは、以下のリンク先情報から作成しました)

春の俳句30選

夏の俳句30選

秋の俳句30選

冬の俳句30選


新規classifierの作成

Watson Studioのプロジェクト管理画面から、「New Language Classifier model」のリンクをクリックします。

スクリーンショット 2018-08-30 19.47.24.png

下の画面が表示されたら、ガイドに従い、あらかじめ用意したCSVファイルをアップします。

スクリーンショット 2018-08-30 19.47.49.png

アップロードが完了したら、今アップしたファイルにチェックをつけた上で、「Add to model」をクリックします。

スクリーンショット 2018-08-30 20.00.25.png

CSVの書式に問題がなければ、下のような画面になるので、「Train model」をクリックします。

スクリーンショット 2018-08-30 20.04.17.png

下のようなモデルの言語選択のパネルがでるので、「Japanese」に変更をした後で、「Train」をクリックします。

スクリーンショット 2018-08-30 20.04.47.png

学習が始まると、下のような画面となります。

スクリーンショット 2018-08-30 20.05.00.png

正常に学習が終わると、次のような画面になるので、ガイドに従い、下記のリンク先をクリックします。

スクリーンショット 2018-08-30 20.13.35.png

リンク先の画面は次のようになっています。

スクリーンショット 2018-08-30 20.15.34.png

Testタブをクリックすると、簡易テストの画面が表示されます。

テストのやりかたは簡単で、「Enter a phrase to classify」の欄に分類したい対象の文章を入力して、「Classify」ボタンをクリックします。結果は下の図のように表示されます。

スクリーンショット 2018-08-30 20.31.17.png