はじめに
Watson StudioでNLCの学習をどうするか質問されたので、その手順をメモします。
[2020-04-25] 事前準備手順修正
事前準備
無料でなんでも試せる! Watson Studioセットアップガイド
でWatson Studioのワークスペース作成までを行います。
更にこの手順書の「オプション」にあるのと同様の手順でNLCサービスの登録、連携を行います。
Watson Studio自体はライトアカウントで可能ですが、NLCはLiteプランがなく、Standardプランは登録するだけで(一切利用しなくても)月20ドル(約2000円)かかる点はご注意下さい。
登録が終わった後の、Watson Studio Project Settingsの画面は次のようになります。
CSVファイルの用意
学習に利用するCSVファイルを用意します。
CSVファイルは、従来と同様の "例文","クラス名"
の形式です。
文字コードはUTF-8にして下さい。
以下に、学習データ例の一部を添付します。
"しおるるは 何かあんずの 花の色","spring"
"山路来て 何やらゆかし すみれ草","spring"
"長持に 春ぞくれ行く 更衣","summer"
"目には青葉 山ほととぎす はつがつを","summer"
"この道や 行くひとなしに 秋の暮れ","autumn"
"枯れ枝に 烏のとまりけり 秋の暮れ","autumn"
"初時雨 猿も小蓑を 欲しげなり","winter"
"いざ子ども はしりありかん 玉霰","winter"
(このデータは、以下のリンク先情報から作成しました)
春の俳句30選
夏の俳句30選
秋の俳句30選
冬の俳句30選
新規classifierの作成
Watson Studioのプロジェクト管理画面から、「New Language Classifier model」のリンクをクリックします。
下の画面が表示されたら、ガイドに従い、あらかじめ用意したCSVファイルをアップします。
アップロードが完了したら、今アップしたファイルにチェックをつけた上で、「Add to model」をクリックします。
CSVの書式に問題がなければ、下のような画面になるので、「Train model」をクリックします。
下のようなモデルの言語選択のパネルがでるので、「Japanese」に変更をした後で、「Train」をクリックします。
学習が始まると、下のような画面となります。
正常に学習が終わると、次のような画面になるので、ガイドに従い、下記のリンク先をクリックします。
リンク先の画面は次のようになっています。
Testタブをクリックすると、簡易テストの画面が表示されます。
テストのやりかたは簡単で、「Enter a phrase to classify」の欄に分類したい対象の文章を入力して、「Classify」ボタンをクリックします。結果は下の図のように表示されます。