私が昔オラクルにいた時に一緒に仕事していた仲間が現在もGoogleのCloudチームにいたり、仕事上でもGoogle BigQueryのチームとは仲良かったりしますが、それにしても、最近のGoogleは会社としてはどんどんとIBMやOracleのように悪い意味でエンタープライズ化してきていますね。その顕著な例がカンファレンスでの発表のたびに必要以上なハイプが出てくるということです。
例えば、最近のレストランやヘアサロンの予約の電話ができるといっていたGoogle Duplexですが、結局は限られたシナリオでしかまだ使えないようなデモレベルであったり、AutoMLでMachine Learning(機械学習)を自動化できるといい出したり、さらに最近だとBigQueryでMachine Learning(機械学習)ができるようになると大きな発表をしているわりには、よくみると線形回帰とロジスティック回帰のみのサポートであったり。(ちなみに、線形回帰とロジスティック回帰自体がたいしたことないと言っているわけではありません。これらは現在でも特にデータ分析系のデータサイエンティストには最も人気のあるよく使われるアルゴリズムですし、このあたりのStatistical Learning(統計学習)系のアルゴリズムはデータの中の関係を解明していきたいようなデータ分析では非常に役立ちます。)
今回は、AIの世界でもそのタレントと研究力に定評のあるfast.aiの人たちがGoogleのAutoMLに関してのハイプを解き明かし、なぜGoogleの主張がおかしいのか、さらになぜそういう事を言う金銭的なモチベーションに関しての解説が「Google's AutoML: Cutting Through the Hype」という形で発表されていました。ここでは、その一部の「なぜGoogleはAIに関してのハイプを撒き散らすのか」に関しての下りを紹介しておきます。
以下、一部抜粋して訳。
GoogleのAutoMLには様々な限界があるにもかかわらず、なぜそれが証明する役立つ割合に比べて不釣り合いなほどに大きいハイプをGoogleは吹き続けるのでしょうか。
アカデミックな研究部門も企業が抱えてしまうことの問題
GoogleのAutoMLは利益を求める企業の中にアカデミックな研究部門を持つことの危険を提示しています。興味深い学問的な研究成果が出ると、それが実世界でのニーズを満たすかどうかの評価をすることなしに、その技術をもとに新しいプロダクトを作りたいという誘惑にかられてしまいます。これは、MetaMindやGeometric Intelligenceといった、結局ビジネスに繋がるプロダクトを作ることもなしにアキハイアー(人材採用が目的の買収、Aquisition + Hire)で終わってしまった多くのAI系スタートアップにも共通するストーリーです。私からのスタートアップのファウンダーに対してのアドバイスとしては、博士論文をもとにプロダクトを作ることは避けるべきで、アカデミアの研究者だけを採用するのも避けるべきです。
マーケティングのうまいGoogle
Googleはマーケティングが非常に得意です。AIはそもそも外部の者にとっては理解しにくく、恐れ多い分野であり、その主張が本当なのかどうかを正しく評価するのが難しいと思われています。それが特にGoogleのような王者のような会社によって出される主張であればなおさらです。多くのジャーナリストがこの罠にはまってしまい、Googleの作り出すハイプをそのままヘッドラインをにぎわすような記事にしてしまいます。Googleの様々な機械学習のプロダクトの話に興奮してはいるが、そうしたプロダクトに実際に自分の手で触れたことはなく、さらにそれがどう動くのかを説明することも出来ないといった、機械学習を専門としないメディアの人達と話す機会が実際よくあります。
Googleによる紛らわしいニュースの例としては、GoogleのAIの研究者が深層学習のテクノロジーを使って人間のゲノムを再構築することができるようになったと、Wiredマガジンが取り上げたときです。 ジョンズ・ホプキンス大学の、医工学、コンピュータサイエンス、および生物統計の分野で有名な教授であるSteven Salzbergは、その研究は実際には人間のゲノムを再構築などしておらず、それまでのソフトウェアに対する少しの改善か、ひょっとしたらそれ以下かもしれないと指摘することとなりました。他にも多くの遺伝学の研究者がSalzbergに賛同しています。
実際にはたくさんの優れた仕事がGoogleで行われています。こうした私達を間違った方向に導くようなハイプをGoogleが次から次へと発表することがなければもっとそういったことに対してポジティブに評価できるだけに、残念です。
Google Cloudのビジネス戦略はたくさんの計算処理をクラウドでさせること
深層学習のアルゴリズムを効果的に使うためにはもっと大きなコンピューター処理能力が必要だと私達を説得することが、Googleにとってのビジネス上のメリットなのです。なぜならこの分野で彼らは他のどの競争相手よりも優れているからです。AutoMLを使うのは大抵の場合、コンピューターの能力的にとても高価になります。AmoebaNetの学習のために450 K40 GPUs を 7 日間(普通のGPUにして3150日)流し続けるといったGoogleが示す例のように。
エンジニアとメディアはベアメタルのパワーとスケールの大きなものに対して、ついつい興奮してしまいますが、イノベーションとは本来そうしたものから生まれるのではなく、逆に、制約と創造性から生まれるということを歴史は証明しています。Googleはとにかく可能な限り大きなデータと可能な限り最も高価なコンピューター能力を使って問題を解決していくことが得意です。しかし、そうした考え方は、限りある資源の中で、制約の多いこの世界に生きる私達一般の人間が抱える問題の解決にほんとうに役立つのでしょうか。
イノベーションとは、それまでより大きいということから生み出されるのではなく、それまでとは違ったやり方をすることから導き出されるものではないでしょうか。
以上、訳終わり。
ここで、公平を期して言っておくと、こうしたAIに関するハイプはGoogleだけではなく、どこの企業でも学校でも研究所でも実際多かれ少なかれ吹かれているものです。現在のようなAIに関しての狂想曲ががんがんと毎日鳴り響いている状況では、そうした状況はしばらく続くでしょう。
以前、IBMがワトソンというソリューションをマーケティングでハイプを作りながら、できる以上のことをできると約束して売りまくったせいで、その後多くの案件で吹き荒れている火の後始末で大変になっているという話をこちらでしました。
私が昔働いていたオラクルではこういうことはしょっちゅうでした。ものすごい大判風呂敷を広げてとりあえず売りまくりその後で人を沢山放り込んでは、つぎはぎソリューションでなんとかやり過ごす、だめなら、将来の契約へのディスカウントをちらつかせる、それでもだめなら訴訟なんてことになっていましたが。
Googleも今やGoogle CloudとしてAmazon、Microsoftに対抗する形でエンタープライズ向けのビジネスをしっかりとやっていこうということで、そうすると顧客としての大企業の幹部やCIOに伝わりやすいメッセージを出していかなければいけないというプレッシャーが強いでしょうから、それもしょうがないのかもしれません。
しかし、Googleはすでにピークを過ぎシリコンバレーでは以前ほどの人気はないのは確かですが、それでもAIを含むテクノロジー全般で、あいかわらず最先端を進んでいますし、まだまだ業界でもトップクラスの優れた人材を多く抱えているだけに、安っぽいマーケティング戦術でそのブランドに傷をつけてしまっているのがもったいないように思います。
私が個人的に心配するのは、こうしたハイプで世の中を煽りすぎると、その後その期待が裏切られたときのショックが大きすぎて、AIだとかデータサイエンスに対しての必要以上の警戒心を多くの人の頭に植え付けてしまうことになることです。これでは、こうしたAIなり機械学習の手法をさっさとうまく取り入れていくことに成功した企業と、まだ始めることができていない企業との差が、さらに開いていってしまうということになります。
これは、Googleだけでなく、私達AI、データサイエンスに関わる全ての人間が肝に命じておくべきことだと思いますが、地に足の着いた形で、AIなりデータサイエンスの本当の価値を真摯に世の中に広めていきたいものですね。
データサイエンス・ブートキャンプ10月開催!
この10月の中旬に、Exploratory社がシリコンバレーで行っているトレーニングプログラムを日本向けにした、データサイエンス・ブートキャンプを東京で開催します。データサイエンスの手法を基礎から体系的に、プログラミングなしで学んでみたい方、そういった手法を日々のビジネスに活かしてみたい方はぜひこの機会に参加を検討してみてください。詳しい情報はこちらの[ホームページ](https://ja.exploratory.io/training-jp?utm_campaign=google_ai_hype&utm_medium=blog&utm_source= qiita)にあります!