世界中の情報を整理して人々がアクセスできて使えるようにすることを使命としているGoogle。モバイルファーストから「AIファースト」に舵を切りAIの民主化も標榜しているGoogleのAIの取り組みは、Wiredでも頻繁に取り上げられています。Googleが最近取り組んでいる機械学習システム構築の自動化はどこまでできているのか。一方で大幅に認識精度をあげて人間よりも認識率が高くなったともいわれている画像認識ですが、2015年に問題となった「ゴリラ問題」をまだ解決できていないのか、Wiredが追い続けているGoogleのAIへの取り組み記事からピックアップして紹介します。
※下記サイトからの転載。ビッグデータ・AIなどに関するトピックを毎週取り上げています。
TechCrowd: https://www.techcrowd.jp/related/
サンダー・ピチャイが語った:グーグルが描く「AIファースト」と「未来のクラウド」の全貌
2017年6月に掲載されたWiredの記事です。2017年5月に開催されたGoogle I/Oの2日前にグーグルCEOのサンダー・ピチャイがWired記者のインタビューに応えた内容が掲載されています。
GoogleがAIに力を入れているのはさまざまなメディア報道からも感じられますが、Googleがビジネス戦略としてAIにどのように取り組んでいこうとしているのかが浮き彫りになるインタピューとなつています。
TPUというAIチップの開発からGoogleのAIへの取り組みについての話は始まります。AIチップは「Google翻訳」のようなAIサービスをより充実させるためのもので、ソフトウェアだけでなくチップレベルでのブレークスルーにも取り組んでいるわけですが、チップの外板は考えておらず、クラウドサービスにより一般の人々が簡単にAIを使えるようにする、つまり「AIの民主化」を進めることを考えているとのこと。
また、AIのクラウドサービスでの提供においてAIチップとともにサンダー・ピチャイが強調していたのが機械学習システムの自動化を目指すAutoMLというプロジェクト。機械学習システムの構築を専門家でなくとも簡単に行うことを可能とするオンラインのサーピスAutoMLを提供していくこととのことです。
つまりGoogleはAIチップやAutoMLなどにより差別化した性能をもったAIのプラットフォームとしてのクラウドサービスを進化させてゆき、誰にでも使えるようにして、AIの民主化を進めるとともに、クラウドのサービスとしてNo.1となりGoogleのビジネスの中心にもっていくことを目指しているようです。
人工知能でグーグルが挑む「3つの課題」
2018年4月25日のWiredの記事です。グーグルの人工知能(AI)部門のトップに、シリコンヴァレーでは天才エンジニアのひとりとして有名なジェフ・ディーンが昇格したことを報道するとともに、彼がいかに、グーグルの「AIファースト」戦略を牽引し、世界にイノヴェイションを起こそうとしているのかをまとめた記事です。
ディーンが語った「3つのキーワード」は、機械学習による医療分野へのGoogleの進出、機械学習システム構築の自動化と、AIがかかえる倫理面の問題。
これまでのAIでは限られた領域に特化したAIシステムではいろいろ成功を収めてきましたが、機械に複数のタスクをやらせることでは苦戦が続いています。ディーンは「対処法の分からない未知の問題に取り組めるような、真にインテリジェントで適応力の高いシステム」がAutoMLによって実現する可能性があるともいっています。
一方で、AIがかかえる倫理面の問題とそれに対するGoogleの取り組みに対してもふれています。グーグルには、機械学習システムが「公平」であるよう保証する方法を研究するチームがあるとのこと。2015年に「Googleフォト」が黒人の写真に「ゴリラ」とタグ付けしていることが明らかになる事件がありましたが、Googleフォトではそれ以降、「ゴリラ」「チンパンジー」「猿」といった単語ではタグの検索ができなくなっています。
グーグルは機械学習によって、「機械学習システムの構築」すら自動化しつつある
2017年11月のWired記事です。GoogleのAutoMLプロジェクトについて取り上げています。
グーグルが「AutoML」と呼ぶプロジェクトで進めているのは、機械学習ソフトウェアに機械学習ソフトウェアそのもののつくり方を教えること。すでに人間がデザインした最高のシステムよりも、強力かつ効率的なものがつくられた事例もあるとのこと。
ディープラーニングなどのニューラルネットワークにおいては、AIエンジニアの業務としていろいろな設定を試して、その用途に対してはどのような設定が一番うまくいくかを調べるといった作業が必要となりますが、そのような作業はとても退屈な作業とのこと。またAI実用化の進展、AI技術の進化により、より複雑な課題に取り組むことも多くなりネットワークの規模が大きくなっているので、AI技術者の設定作業も難しさが増しているようです。
そのために機械学習システムの構築の自動化に関するAutoMLのような研究は大学などさまざまなところで行われてきており、実用化に近づいてきてもいるようですが、自動化が進むことによる懸念も指摘されるようになってきています。たとえば、世の中に対する偏見まで備えたシステムを誤って自動的に構築してしまうことがないようにどのようにするかといったことです。
AIの実用化の進展、AIの進化に伴い、さまざまな判断の難しい面も新たに出てきているようです。
グーグルの画像認識システムは、まだ「ゴリラ問題」を解決できていない
2018年1月のWired記事です。2015年に、ある黒人のソフトウェア開発者が自分と友人の写真を「Google フォト」が「ゴリラ」とタグ付けしていることを見つけ、ツイートしたことが大きく取り上げられるという出来事がありました。2年以上たったいまでも、Googleフォトのタグの一覧からはゴリラやほかの霊長類の名前は削除されたままとなっています。
『WIRED』US版が4万枚の動物の写真を使ってGoogleフォトをテストしてみたところ、パンダやプードルを含む多くの動物は見事に検出されましたが、「ゴリラ」「チンパンジー」「猿」といった単語では「検索結果はありません」との答えしか返ってこなかったとのこと。
また、『WIRED』US版は顔認識技術の研究に使われる写真1万枚以上を使って、Google フォトが人間をどのように見ているかも調査。すると、「アフリカ系アメリカ人(African American)」で結果として出てきたのは、なぜかブルーバック亜科(アラビア半島やアフリカに生息するウシ科の動物)の写真のみ。
現在の機械学習は十分なデータと計算能力があれば、画像や文字情報を分析するソフトウェアをかなりの精度にまで訓練することは可能になりました。しかし、ソフトウェアをその訓練を超えたレヴェルに到達させることは容易ではなく、最高のアルゴリズムでさえ、人間のように常識や抽象概念といったものを用いて世界を解釈する能力はもたないので、機械学習のエンジニアは訓練に用いたデータに存在しない「例外」対応におわれています。
Google Cloud Platformのひとつである「Vision API」のオンラインデモで、ゴリラとチンパンジーの写真を試したところ、どちらも被写体の認識が可能でした。しかし昨年10月に「コンピューターヴィジョンの進化」を示すものとしてGoogle フォトに追加された「Google レンズ」という機能では、同じ画像を見せても「うーん…ちょっとわかりません」という答えが返ってきます。Googleのこの慎重な対応は現在の機械学習技術の限界と難しさを示しているようです。