Posted at

TensorFlowとMLサービスの2016年の布教活動報告

More than 1 year has passed since last update.

これはTensorFlow Advent Calendar 2016の記事です。

といっても、皆さんみたいにTFで面白いもん作ってみた、みたいなネタがない(TF力が足りない)ので、TensorFlowとMLサービスのエバンジェリストとしての2016年の布教活動をまとめたいと思います。

ちなみに私は2012年〜2014年はGCPのソリューションアーキテクトとしていろんなソリューションを作るのがお仕事でしたが、2015年からはデベロッパー・アドボケイトとして布教活動とコミュニティ支援活動を担当しており、もうすぐ2年(Googleに入って6年)になります。


2016年に参加したイベント

2016年は国内外合わせておよそ120件のイベントでお話させていただいたのですが、そのほとんどがTensorFlowとCloud ML、そしてVision APIやSpeech API等のML APIの紹介でした。毎週、あちこちに移動してはお話していました。もはや旅芸人です。

image

image

Strata+Hadoop World 2016 NYC

今年セッションを持った大きなイベントだけリストアップすると、


  • Strata+Hadoop World 2016 San Jose & NYC

  • Google I/O 2016

  • ODSC East Boston & ODSC West Santa Clara

  • GOTO Amsterdam

  • Hadoop Summit San Jose 2016

  • MLconf Atlanta

  • SACon London

  • WebTech Con Munich

  • GDG DevFest Hong Kong

  • その他、APACや国内のイベント

などなど、海外の大規模イベントで登壇できる機会をたくさんいただいて、とてもよい経験になりました。東京で働きながらも世界あちこちの仕事に携われるフラットさが、Googleという会社のほんとすばらしいところです。

国内でもたくさんのイベントに参加しました。同じ日に4つのイベント(LinuxCon、db tech showcase、Google for Mobile、お客様向けイベント)で登壇することもありました。これはスケジュールがきびしかった。

image

引き続き来年も、Google Cloud Next 2017 San FranciscoやStrata+Hadoop World 2017 LondonでTensorFlowのセッションを持つ予定です。


2016年に作ったコンテンツ


Cloud Vision Bot

イベントでの登壇に加えて、もうひとつのお仕事がデモやブログ等のコンテンツの作成です。Cloud Vision APIで作ったRasPiロボットカー「Cloud Vision Bot」は社内でも好評で、Google I/Oのセッションではほとんど猿回しな様子がウケてたので結果オーライでした。その他、GCP NEXT LondonやAtmosphere MelbourneとMumbai、バルセロナのMobile World Congress等々、あちこちのイベントからお声がかかって、ボット君を抱えてデモしに行きました。

image

ボット君とのボケ・ツッコミの猿回し芸を確立


Cloud Vision Explorer

今年3月にGCP NEXTというイベントがサンフランシスコで開催されたのですが、その2週間ほど前にUSのプロダクトマネージャから「Jeff Deanのキーノートデモ用に、Cloud Vision APIのカッコいいデモ作ってくれないか」とむちゃぶりされて、その方面でファンタスティックな能力を持つReactiveさんにお願いして10日で作っていただいたのがCloud Vision Explorerです。

image

GCP NEXT SFでのJeff Deanのキーノート

Vision APIで8万枚の画像のラベルとスコアを取得して、それをTensorFlowで実装したt-SNEで次元削減、3D空間上に表示するデモです。カッコいい。個人的にはJeff様と直接お仕事のやりとり(仕様決め、レビュー、修正など)をできたのが感無量でした。

ちなみに、このデモはGoogle Cloud Storageだけでホスティングされており、完全サーバレス。なのでメンテ不要だし、一般公開しても可用性や負荷について気にする必要がありません(デモの一般公開ってこの点が難しい)。今でも社内外でVision APIのデモに広く利用されています。


TensorFlowできゅうりの仕分け

GCP公式ブログで今年書いた記事のうち、いちばん注目されたのは「How a Japanese cucumber farmer is using deep learning and TensorFlow」(日本語版:キュウリ農家とディープラーニングをつなぐ TensorFlow)でした。

image

小池さんご一家ときゅうり畑

小池さんのブログ記事を見て、これはすごい、絶対取材に行きたい! って思ったとき、私の頭のなかには「青空の下に広がるきゅうり畑の写真から始まるディープラーニング記事」のイメージが浮かんでいました。静岡にある小池さんのきゅうり畑に伺い、その思い通りの絵が撮れて、さらにお父さんとお母さんからもきゅうりの仕分けの難しさや新鮮さの証である表面の「イボ」について詳しくお話を聞けたのがとても嬉しかったです。このディテールとリアリティ。取材に行ってよかった。

このきゅうり記事はグローバルでバズり、英語版のNewsweekをはじめ多数の海外メディアでシェアされました。各国にいる私の同僚達も、「日本ではきゅうり農家がディープラーニング試してるんです。あれ、皆さんはまだですか」って感じで紹介してくれています。


ディープラーニングの民主化

小池さんの事例のすばらしい点は、TensorFlowによるディープラーニングの民主化を体現しているところです。

ディープラーニングを使いこなすのは簡単ではありませんが、最先端の現代数学を駆使したロケットサイエンスというわけでもありません。enakai先生もこうつぶやいてます。


たとえば、「ディープラーニング」に限定すれば、あれ、数学的には必要な範囲は相当せまくて、ぶっちゃけ、行列計算と微分ができればいいですよ。いまのディープラーニングの発展は、ネットワークの構造をどう作るかという工学的な様相を呈していて、数学として面白い何かって少ないきがするんです。


例えばTensorFlowの「テンソル」と言っても、つまり多次元配列のことであり、物理学のテンソルを理解する必要はありません。ちなみに、私はニューラルネットの教科書にエントロピーという言葉が出てきたところで「熱力学や情報理論の理解が必要なのか……シャノンの定理なんて忘れたよ……」と絶望しましたが、そんなことはありませんでした。いろいろ素人トラップが多すぎで困ります。

むしろ、最先端の研究者にとってもディープラーニングは未だに謎が多いブラックボックスで、どうやら「よく分かってない部分も多いがいろいろ試してみて良い結果が出たもん勝ち」という状況のようです。データサイエンティストでなくてもディープラーニングの簡単なモデルなら十分に使いこなせることは、すぎゃーんさんのアイドル顔識別有山さんのめがねっ娘識別などのすばらしい事例でも示されています。

image

すぎゃーんさんがDCGANで生成した非実在アイドル顔画像

どういう学習データを集められるか、小池さんの例で言うときゅうりを毎日的確に選別してくれるお母さんがいてくれること、そして日々の現場の課題をTensorFlowで解決しようという小池さんの発想と「やってみた」が、きゅうり事例の重要な要素となっています。今後ディープラーニングや機械学習の応用をより簡単にするサービスが提供されていけば、こうした「民主化」はより広がっていくだろうと感じています。


TensorFlow Playgroundのすばらしさを伝えたい

もうひとつ、GCPブログ記事としては「Understanding Neural Network with TensorFlow Playground」(日本語版:TensorFlow Playgroundでわかるニューラルネットワーク)を書きました。

image

TensorFlow Playgroundで二重らせん問題を解く

TensorFlow Playgroundって本当にすばらしいデモなのですが、それを使ってニューラルネットのしくみをじっくり解説している記事は見当たらない。その一方で、一般的なニューラルネットの解説記事ではまず学習アルゴリズムであるバックプロパゲーションや勾配降下法が出てくるので、その偏微分の式が出てきた時点で私のような数学苦手な読者はそっとページを閉じてるだろうな……コンバージョン率低そう……と感じていました。

image

(図はイメージです)

そこで、学習アルゴリズムとその数式の解説をとりあえず置いといて、まずはPlaygroundを手元で実際に動かしながら直感的なとっかかりを得ることを意図したのがこの記事です。一般のITエンジニアやビジネスユーザの方に「コンピュータががんばってデータから特徴を見つけ出そうともがいているようす」を見てもらい、ニューラルネットや機械学習が普通のプログラミングと決定的に違うところを感じてほしいと思いました。

image

colah大先生のブログから

もうひとつ、私自身が理解に時間を要したのが、ニューラルネットにおける隠れ層の役割です。これについてはenakai先生とDavid Ha先生、それにcolah大先生から助言をいただいて、「データを特徴空間にマッピングして超平面で分割する」という隠れ層の働きをcolahさんのビジュアルといらすとやの組み合わせでなんとか伝えようとしています。Googleの公式ブログでいらすとやを使えたのが嬉しかったです。

image

隠れ層ってつまりこういうことか


TensorFlow User Groupはじまる

そして10月には、TensorFlow User Group(TFUG)がスタートしました。もともとはブレインパッドの下田さんやJSOLの中村さん、GCPのパートナーセールス担当の山本さんと、そろそろTFのユーザー会がほしいですね〜と話していたのがきっかけです。下田さんと中村さんのお二人が発起人となり、旗揚げしていただきました。

images

第1回、第2回ともに270名近い登録をいただく人気ぶりです。第1回ではJeff DeanとともにTensorFlowチームを立ち上げたGreg Corradoをキーノートに招き、さらにNHKさんの取材班も入って翌朝7時の「おはよう日本」で紹介されるという謎の盛り上がりを見せました。

images

10月ごろにMountain Viewに行ってGoogle BrainのTensorFlow開発チームとミーティングしたとき、この日本でのTFUGの盛り上がりを紹介してきました。TFUG for Bizでも発表のあったアクサさんの自動車保険事例やオークネットさんの自動車画像認識デモを紹介すると、Rajat MongaやMartin Wicke、Pete WardenといったTFチームのリーダ達がすっごく喜んでくれました。


コミュニティとエコシステムで「実案件で使えるディープラーニング」に

TensorFlowのいいところは何か? と聞かれると、スケーラビリティや分散実行環境についても説明しますが、なんといってもTFUGに代表されるユーザーコミュニティとエコシステムの層の厚さをいつも強調します。そのおかげで、TFは単なるバズで終わらない実案件で使えるディープラーニング技術に育っていると思います。

ここ1年ほど、Googleの機械学習に興味を持っていただいたお客様に、ML APIやTFについて説明する機会がとても増えました。私の説明を聞いていただいて、これは面白い! ぜひやろう! と話が進んだとき、次のステップとして、お客様が持っているデータとML APIやTFで実際に何をどこまで実現できるのか、というブレストやPoCの段階に進みます。

ここでとても重要なのが、ディープラーニングを使いこなして実際のPoCまで進められる数多くのパートナー企業さんの存在と、今年のTF Advent Calendarのように「TFでやってみた」系の日本語記事をたくさんシェアしてくれるエンジニアの皆さんの存在です。TFUGのミートアップや論文飲み会、Facebookグループでは、TFやML APIで実績を持つエンジニアの皆さんが集まり、新しい手法やtips、苦労した話、うまく行かなかったケースなどがシェアされています。

image

TFUGに集まるエンジニアも、TFのでかいモデルをぎゅっと圧縮してスマホに収めた人、自動車向けの画像認識で圧倒的に強い人、音声認識で国内第一人者な人、誰でも扱えるUIを作った人、FPGAで激速化した人、さらには金融、医療、製造、流通、マーケティングなどなど、それぞれに異なる得意分野でディープラーニングと戦って経験を積みながら成果を上げている方々が集まっています。


AIやりたい → TFパートナーが支援 → IT部門で実開発

こうしたエコシステムのおかげで、「CxOレベルでのディープラーニングへの興味関心」にとどまらず、実際に「IT部門による実開発」へと進む案件がいくつか現れています。オークネット(AUCNET IBS)さんによるKonpekiの事例も、そうしたケースのひとつです。

image

AUCNET IBSさんが開発したクルマ画像判定システムKonpeki

一年ほど前に私がオークネットさんにお伺いしてGoogleの機械学習について紹介したとき、オークネットさん自身はディープラーニングや機械学習の経験をお持ちではありませんでした。そこでまずはブレインパッドさんと吉積情報さんによるコンサルティングとPoC開発を提案し、TFの使い方やGCPと組み合わせたシステム構築の手法、転移学習による学習効率の改善などの技術導入を進めていただきました。そして現在では、オークネットさん単独でTFによる画像認識プラットフォームの開発がぐんぐん進んでおり、まもなく大手中古車ディーラーさんでの実運用が始まります(このいきさつについてはTFUG for Bizでも紹介されましたが、来年はじめにGCPブログで詳しくレポートしたいと思います)。

この事例のように、TFコミュニティのパートナー企業の力を借りて、一般のITエンジニアがディープラーニングを学んで使いこなしていくという流れが始まりつつあります。こうしてコミュニティとエコシステムの力を得てTensorFlowが現場で役に立つ技術として育っていくのを見て、そのきっかけ作りに携われたのがとても嬉しい一年でした。


2017年もTensorFlowとMLサービスを布教します

ということで、2016年は私にとってTensorFlowとMLサービスの年でした。たくさんのエンジニアやお客様とお話して、まじすごいって思える事例も目の当たりにし、こりゃ来年ドカンとくるなという手応えを感じています。来年も引き続き布教活動に勤しんでいきたいと思います。


Disclaimer この記事は個人的なものです。ここで述べられていることは私の個人的な意見に基づくものであり、私の雇用者には関係はありません。