More than 5 years have passed since last update.

Cloud Auto MLをとりあえず使ってみた。

Posted at 2018-08-08

先月の7/24に、GoogleからCloud Auto ML Natural Languageというものがリリースされました。
http://www.itmedia.co.jp/news/articles/1807/25/news066.html

ページの後半で、Natural Languageを触った感触などを書いています。

このCloud Auto MLというのは何かと言うと、ほぼGUIだけで機械学習したモデルを作ることができるサービスの総称で、その中にNatural Language(自然言語)、Translation(翻訳)、Vision(画像認識)というものがあります。

それぞれのサービスの役割

Natural Language

NLと銘打っておきながら、できることはテキストデータのカテゴライズです。
テキストとラベルの組み合わせをCSVなどで用意して、アップして数クリックするだけで、学習されたモデルが作成されるサービスです。

Translation

これは翻訳用のML自動化サービスです。機械翻訳をするために、テキストと翻訳データを用意して、自分のデータセットで学習させることができます。

Vision

これは画像が何であるか、というカテゴライズをするための仕組みです。
画像の中の物体検知ではなく、あくまで一つの画像に対するラベリングですね。

さて、NLを実際に使ってみたよ

某HKのニュースのRSSデータを取得して、それぞれもともとのカテゴリをラベル付けして、カテゴライズできるかをテストしました。

APIの有効化

まずプロジェクトに対してAuto ML NLを使うために、APIを有効化します。
ワンクリックで自動でやってくれるボタンもありましたが、なかなか時間がかかっていたので、その横にあるマニュアル設定のボタンから、指示通りにAPIを有効化しました。

学習用CSVの用意

他にもやり方ありますが、CSVを使ってデータを登録する方法を書いていきます。

実は一番困ったのはここで、公式ドキュメントに「どんな形式のデータを用意すればいいか」という具体例がないという。英語だけだったので不安でしたが、想像はできたのでなんとか作ることができました。
なのでここには具体例を書きますが、こんな形でデータトラベルの対のCSVを用意します。

"こんにちは、電気グルーヴです。電気で作る、グルーヴです。", denki
"僕は音楽家、電卓片手に足したり引いたり操作して作曲する", kraftwerk
"君に、胸キュン。浮気な夏が僕の方に手をかけて", ymo
"このボタン押せば、音楽奏でる", kraftwerk
"誰だ！ゴクミに似てるのは", denki
"日本でも放射能、今日もいつまでも", kraftwerk
"俺のビデオを消したやつは誰だ！", denki
...

ポイントは