初心者
機械学習
MachineLearning
GoogleCloudPlatform

専門家なしで誰でも使える(ガチ勢でも便利),機械学習の大本命 Google Cloud AutoML 発表

tl;dr

機械学習の恩恵を,先陣を切るGoogleから手軽に受けられるように
しかも勝手によしなにしてくれるので,学習させたいものを与える以外に何もする必要がない
まずは画像の分類から

背景

機械学習はこれまでにも,オープンソースやe-ラーニングなどで広く開かれている技術ではありました.
しかし専門知識が要るのは依然として変わらず,急成長しているため追従も大変でした.

Cloud AutoML

ブラウザ上のGUI(あるいはAPI)からプログラミング不要で,誰でも機械学習を利用することができます.
学習させたいものを与える以外に何もする必要がありません.あとはいい感じに学習してくれます.
最初は画像認識から,今後は音声認識,翻訳など拡大されていく予定です.
Screenshot 2018-01-18 at 11.29.16.png
 
その容易さにも関わらず,たった数十枚の画像サンプルで学習させることができるとのこと.
(一昔前は膨大なデータを必要とするのが当然だった1
 
数分で簡易的に,1日以上かけると高精度な学習ができます.
ディズニー2などで既に有用性が実証されています.
 
まだアルファ公開なので,価格やドキュメント詳細は不明なのと,現状申し込んで招待を待つ必要はあります.

実際

使っている様子はこちらから.
3の専門的な用語を教え込む様子が録画されています.
ink.png
 
アルファなので変更の可能性はあるでしょうが,色々と読み取れる情報がありますね.
・ラベルは2-100種類の間
・画像は20-100,000枚の間
・1ラベルあたり最低10枚

ラベル付けを人力で行ってくれるオプションがあったり,学習後の評価時にPrecision-Recall曲線やROC曲線など表示されていたり,CLIからも使えたり,エクスポートなどもあるようですね.

Cloud ML Engineとも連携できるようですが,一体どうなるのでしょう
もし深く統合されると凄そうですが,統合のされかたは謎です
ね.

ただAPIが叩きやすい程度の話かもしれません.
追記:公式サイトの記載をふつーに見落としていました.学習済みモデルをCloud ML Engineで動かせるようです.Thx @hayatoy !

TechCrunchの記事などではまた少し違ったUIのスクリーンショットが掲載されています.
Google Cloud PlatformのUIとしてはこちらのほうが近そうに見えますが,1ラベルあたり最低100枚にすべきなどと記載があるので,むしろ古いものかもしれません.

内部技術

CIFARやImageNet(一般公開されている学習用データ)でトップクラスの性能(2017/05)を出した技術が一般に公開される流れです.
具体的な中身としては,転移学習4とNeural Architecture Search56が活用されています.
その他明記はされていませんが,もちろんTensorFlowTPUなども使われていることでしょう.
logo.pnggoogle-cloud-tpus-part-of-a-trend-towards-ai-specific-proces_phvw.640.jpg

 
専門でなくとも恩恵が受けられるものなので,MLガチ勢には一見退屈かもしれません.
しかし(再掲ですが)Google側でラベル付けを人力で行ってくれるというオプションもありますし,学習済みモデルをCloud ML Engineで動かすことも可能(ということは他所のTensorFlow上でも動かせるかも?)なので,ガチ勢的にもなかなか面白いではないでしょうか.

競合

一般公開されている競合サービスにはこんなものがあります;SONYのNeural Network ConsoleDataRobotThx, @ANNRabit !
プレビュー版であれば,Clarif.aiやAzureのCognitive Services(の一部)など.

しかしおそらく質的には追随を許さないでしょう(個人の主観です).
皆さんご存知の通り,Googleは機械学習に関しては最高峰です.
スマートスピーカ一つ取っても,Google Homeの音声認識の精度は他社製品より頭一つ抜けているようですし.
unnamed.png

まとめ

ということで,機械学習の恩恵が手軽に受けられるようになります.
みんなで巨人の肩に寄生しましょう.

コミュニティ

GCPUG(Google Cloud Platform User Group)7
(Slackの日本語雑談は#generalではなく#general_jaなので注意!)
logo_box.png

参考文献

公式

公式サイト
公式動画
公式ブログ

メディア(一部)

GoogleのAutoMLで誰もが機械学習を利用できる――プログラミング不要、ビジネス利用へも(TechCrunch)
Google、データさえあれば素人でもAIを構築できるサービスを展開(PC Watch)

技術的

Using Machine Learning to Explore Neural Network Architecture
Learning Transferable Architectures for Scalable Image Recognition
Progressive Neural Architecture Search
Large-Scale Evolution of Image Classifiers
Neural Architecture Search with Reinforcement Learning
Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
Bayesian Optimization for a Better Dessert
 

 

 


  1. もちろん今ではワンショット学習などもありますが,コストや汎用性その他の理由により実用化にはまだ至らないのでしょう. 

  2. Disney Consumer Products and Interactive Media.詳細(ユーザの声)は公式サイトの下部. 

  3. ここでの雲とは,ウェブを介して提供される従量課金制の計算資源,いわゆるクラウドではなく,惑星表面の大気に浮かぶ水の集まり,いわゆる単なる雲である.もくもく. 

  4. 一度行った学習を他所にも流用できる技術. 

  5. メタ学習の一つ.RNNでNNを調整していく.pruningしてグラフを軽量化するとかしてそうです.Thx again, @hayatoy !ちなみに日本語で何て言うの?これ 

  6. 公式ブログではlearning2learnというものも言及されていますが,単にメタ学習の別名のようです.詳細はこちらのようです. 

  7. GCPUGのSlackで,今日機械学習のチャンネル(#c-ml_ja)にみんなわんさか参加してきててもはや草