*AIという言葉が反乱しすぎて、一般的なコンシューマーよりエンジニアとして全体像がよく分かってない部分が多いので真面目に翻訳しながら記事を読んでみました
(翻訳の品質は確約できない部分もあるのでご自身でも下記URLより原文を確認してみてください。)
人工知能はターゲットを変えています。より良い目標を達成する方法は次の通りです。
AIはどこにでもあるように感じます。自宅や携帯で体験できる事ができます。
私達がこれを知る前に—起業家やビジネスイノベーター達が信頼していたので—AIは私達が購入し使用する全ての製品とサービスの中にあります。
おまけに、ビジネスの問題解決への応用は飛躍的に拡大しています。
同時にAIの影響が懸念が高まり: 私達は職場、雇用社会へのAI対応の自動化について懸念しています。
リアリティは時として恐怖とヘッドライン(見出し)の勝利の狭間で失われる事があります。
例えば、Alexa, SiriやAlphaGoなどはそれ自身がAIテクノロジーです。つまり、機械学習とそのサブセットです。
ディープラーニングについては未だたくさんの制限があり克服する為には相当な努力が必要です。
この記事は、それらの制限について、何がAIへの取り組みを妨げているかについて、経営幹部がよりよく理解する事を目的として書かれています。
途中で、幾つかの限界に取り組み新たな機会を想像する有望な進歩についてハイライトします。
私たちの視点は、数百の実世界のユースケースを調査、分析、評価したりする、最前線の業務と
思考的なリーダー、先駆的な科学者、AIの最前線で働くエンジニアとの協力に基づいています。
自分たちの独創力だけに晒されて、どこにフロンティアがあり、AIのペースメーカーが何を既に実行しているのかを測定できていない経営幹部を支援する為にこの知見を掘り下げるように努めました。
完結に言えば、AIの課題と限界はリーダーにとって「移動するターゲット」の問題を作り出しています。
いつも進歩している最先端情報に到達していくのは難しい事です。
また、AIへの取り組みが現実世界の障害にぶつかり、さらなる投資欲求の軽減や、待ち伏せ状態の促進、他の人が先に充電する場合などは残念です。
最近のMcKinsey Global Instituteの調査によるとAIセクター内外で先導者とそうでない人の間に厄介な差異があります。(Exhibit 1)
これらのギャップを狭めることを望む経営陣は、情報に基づいた方法でAIに対処できなければなりません。
言い換えると、AIがどこで革新、洞察、意思決定をどのように高めることができるかだけでなく、
効率の把握、収益の成長につながる事についても理解する必要があります。
(しかしAIがまだ価値を提供できていない所でもあります)
その上、文化的障壁のような技術的制約と組織的制約との関係と区別を認識しなければならなりません。
そのようなビジネスの準備ができている人材の不足、AI駆動アプリケーション、製品やプロセスにAIを組み込むという "ラストマイル"の課題があります。
これらの限界やAI軌道の潜在的湾曲を克服し、有望な開発を活用するために準備されています。
AIの進歩を遅らせる重要な技術課題を理解しているリーダーになりたいのであれば是非読んでください。
挑戦、制限、機会
有用な出発点は、デープラーニングの最近の進歩を理解することです。
おそらく、AIの中で最もエキサイティングな開発であり、これらの進歩は、分類と予測の精度の飛躍をもたらしております。
これらは、伝統的な監督下の学習に関連する通常の「フィーチャエンジニアリング」なしで実現されています。
ディープラーニングは、数百万のシミュレートされた「ニューロン」を層状に構成することができる大規模なニューラルネットワークを使用します。
最も一般的なネットワークは、畳み込みニューラルネットワーク(CNN)および再帰型ニューラルネットワーク(RNN)と呼ばれ、
これらのニューラルネットワークは、トレーニングデータおよびバックプロパゲーションアルゴリズムの使用によって学習します。
多くの進歩見られましたが、まだ改善の余地があります。
重要なステップは、問題へのAIのアプローチとデータの可用性を合わせることです。
システムはプログラムされているのではなく「訓練された」システムなので、
それぞれのプロセスは、複雑なタスクを正確に実行するために膨大な量のラベル付きデータを必要とします。
大きなデータセットを取得するのは難しく、いくつかのドメインでは、単純に利用できない可能性もあり、
もし利用可能な場合でも、ラベリングの作業に多大な人的リソースを必要とします。
さらに、ディープラーニングによって訓練された数学的モデルが、どのようにして特定の予測、推奨、または決定に到達するのかを見分けることは困難なことがあります。
たとえ想定されているものであってもブラックボックスです。
得に、予測や決定のが及ぼす社会的影響や、個人の幸福に影響する効果については有用性に限界があるかもしれません。
これらのケースでは、ユーザーは「なぜ」このような結果になったのかという背景を知る必要があります。
例えば、規制の影響を受けている融資などでは、法的影響を伴う事実上の発見をビジネスの意思決定に至らせることから、アルゴリズムがその推奨に達した理由や、なぜ特定の要因(および他の要素ではない)が与えられた事例において非常に重要であったのかというのも知る必要があります。
これらの制限と具体的な解決策が存在する5つの相互関係を探ってみましょう。
制限1: データラベリング
ほとんどのAIモデルは「教師あり学習」によって訓練されています。
これは、人間が根底にあるデータにラベルを付けて分類する必要があり、大規模でエラーが発生しやすい雑用である事を意味します。
例えば、自動運転技術を開発している企業は、数百人の人を雇って試作車両からビデオフィードを手作業で注釈付けして、これらのシステムのトレーニングを手助けしています。
同時期に、自然に利用する過程でデータにラベル付けをする事ができる、「in-stream教師あり学習」(Eric Horvitzと同僚@Microsoft Researchにより論証)などの有望な新しい技術が登場しています。
「教師なし」または「半教師あり」のアプローチは大きなラベル付きデータセットの必要性を低減します。
2つの有望な技術は、強化学習と generative adversarial networksです。
強化学習
この教師なし技術により、アルゴリズムは試行錯誤だけでタスクを学習することができます。
この方法は、「人参と棒」のアプローチに耳を傾けます。
アルゴリズムが施行ごとにタスクを実行する際、ふるまいが成功したら、「報酬」(より高いスコアなど)を受け取り、失敗した場合には「罰」を受け取ります。
繰り返しにより、パフォーマンスが向上し、学習環境が現実世界を代表する限り、多くの場合能力を上回ります。
強化学習はコンピューターゲームの訓練に使われる事で有名です。
最近では、ディープラーニングと合わせて利用されています。
例えば、2017年5月、AIシステムAlphaGoが世界チャンピオンKe JieをGoのゲームで倒すのを助けました。
他では、マイクロソフトが強化学習利用したユーザーの好みに対応する意思決定サービスを提供しています。
強化学習の潜在的な利用は、多くのビジネス分野で行われています。
可能性は、それぞれ
価値ベースの損益のポイントを取得または喪失するAI主導のトレーディング・ポートフォリオ、
推奨駆動販売のポイントを受け取る商品推奨エンジン、
定刻配達または燃費改善による酬報を受け取るルート追跡ソフト、
などを含みます。
強化学習は、想像もできないソリューションや熟練した実務家でさえも考えられなかった戦略を開発することによって、AIが人間のラベリングの自然と社会の限界を超越するのを助けることができます。
最近では、例えば、AlphaGo Zeroのシステムで新しい強化学習を利用して、
GoをゼロからPLAYすることを学んだ後にその前身のAlphaGoを打ち倒しました。
Generative adversarial networks (GANs).
この半教師学習では、2つのネットワークが互いに競合して、コンセプトの理解を改善し、洗練させます。
例えば、鳥の画像を認識するために、1つのネットワークは、鳥の本物と偽物のイメージを区別しようとしますが、その反対側のネットワークは、鳥の画像に非常によく似ているが、そうではないものを作り出すことによってそれを騙そうとします。
2つのネットワークが四角形に切り分けられているので、各モデルの鳥の表現はより正確になります。
信憑性のあるデータの例を生成するGANの能力は、人間によってラベル付けされたデータセットの必要性を大幅に減らすことができる。
資料診断用の画像から異なる種類の腫瘍を識別するアルゴリズムを訓練すること、
例えば、腫瘍の型または病期を有する数百万の人間によりラベル付けされた画像を必要とします。
様々なタイプの腫瘍の現実的な画像を生成する為に訓練されたGANを利用する事により、
研究者はより少ない人間によってラベル付けされたデータ・セットとGAN’sのアウトプットを併用して腫瘍検出アルゴリズムを訓練する事ができました。
正確な疾患診断におけるGANの適用はまだ途方もなく遠い事ですが、研究者はますます洗練された状況でGANを使用し始めている。
これらは、特定のアーティストのスタイルでのアートワークの理解と制作、地理的特徴の理解を含む衛星画像の使用、急速に発展する地域の最新地図を作成を含みます。
制限2: 大量のトレーニングデータの取得
線形モデルを用いた単純なAI技法は、幾つかのケースでは、医学などの分野の専門家の力に接近する事を可能にする事を知らしめました。
現在の機械学習の波は、ラベル付けされているだけでなく、十分に大きく包括的である訓練データセットを必要とします。
ディープ・ラーニングでは、モデルが比較的良好に分類されるように、何千ものデータレコードを必要と場合があります。いくつかのケースでは、それらが人間のレベルで実行するための何百万というものがあります。
複雑なのは、大規模なデータセットは、多くのビジネスユースケースで入手または作成するのが難しい場合があります。(治療成果をより正確に予測するための限られた臨床試験データを想像してください。)
割り当てられたタスクの各マイナーバリエーションでは、さらに多くのトレーニングを行うために別の大きなデータセットが必要になる可能性があります。
例えば、気象が絶えず変わる鉱山の場所をナビゲートする自律型車両を訓練するには、車両が遭遇する可能性のあるさまざまな環境条件を含むデータセットが必要です。
ワンショット学習は、大規模なデータセットの必要性を減らし、実際のデモや例が少数の場合(場合によっては1つでも)、AIモデルが対象について学習できるようにする手法です。
AIの能力は、1つのサンプルだけが表示された後で、カテゴリの複数のインスタンスを比較的正確に認識できる人間のものに近づくでしょう 。
例えばピックアップトラックを例に上げると、このまだ開発中の方法論ではありますが、
データ科学者は、タスクのバリエーションを提示したり、画像認識の場合には、オブジェクトがどのように見えるかをシミュレーションする仮想環境内でモデルを事前に訓練します。
そして、AIモデルがバーチャルトレーニングで見られなかった現実的なバリエーションのほんの一部を示した後、モデルはその知識を活用して適切な解決策を導き出します。
この種のワンショット学習は、最終的には、著作権侵害のテキストをスキャンしたり、ラベル付きの例が1つだけ表示された後、ビデオ内の企業ロゴを特定するためのシステムに役立ちます。
今日、そのようなアプリケーションは初期段階にとどまっています。しかし、その有用性と効率性は、複数の業界にまたがってAIの使用を急速に拡大する可能性があります。
制限3: 説明能力の問題
AIシステムでは、説明可能性は新しい問題ではありません。
しかし、それはディープラーニングの成功と採用とともに成長し、より多様で高度なアプリケーションとより多くの不透明さをもたらしました。
より大規模で複雑なモデルは、なぜ特定の決定に達したのか(また、それがリアルタイムで達成されたときにさらに困難になる)人間の言葉では説明するのを難しくしています。
これは、一部のAIツールの採用が、説明可能性が有用で実際に必要なアプリケーション領域において、依然として低いという理由の1つです。
さらに、AIの適用が拡大するにつれて、規制上の要件によって、より説明可能なAIモデルの必要性が高まる可能性もあります。
モデルの透明性を高めることを約束する2つの初期アプローチは、local-interpretable-model-agnostic explanations(LIME)とattention techniques(Exhibit 2)である。
LIMEは、プロキシの解釈可能モデルを開発する際に、訓練されたモデルが予測に最も依存している入力データのどの部分を識別しようとします。
この手法では、データの特定のセグメントを一度に検討し、プロキシモデルを微調整するための予測結果の変化を観察し、より洗練された解釈をします。たとえば顔認識により重要なテストする際に鼻よりもむしろ目を除外すること)。
attention techniquesはモデルが特定の決定を下す際に最も考慮する入力データの部分を視覚します。(画像が人間を描いているかどうか測定する為に口に焦点を定める)
しばらくの間使用されてきた別の技法は、generalized additive models (GAMs)の適用である。
single-feature modelsを使用することによって、GAMは機能間のインタラクションを制限し、それにより、各機能はユーザによってより簡単に解釈可能になる。
中でも、これらの手法を採用してAIの出す決定をについて解明することは、AIの採用を増やす方向に大きく進んでいくと予想されます。
制限4: 学習の一般化可能性
人間が学ぶ方法とは異なり、AIモデルには特定の状況から別の状況に経験を応用させる事が困難です。
実際には、あるユースケースに対してモデルが達成したものは、ユースケースのみに適用されます。
その結果、企業は、ユースケースが非常に似ている場合でも、別のモデルを訓練するためのリソースを繰り返しコミットする必要があります。
一つの有望な対応方法は学習の移転です。
このアプローチでは、AIモデルが特定のタスクを達成するように訓練され、その学習を類似した別のアクティビティに迅速に適用します。
DeepMindの研究者は、シミュレーションで行った訓練を実際のロボットアームに移すという実験で、移転学習で有望な結果を示しています。
移転学習やその他の一般化されたアプローチが成熟するにつれて、組織は新しいアプリケーションをより迅速に構築し、より多様な機能を備えた既存のアプリケーションを浸透させることができます。
例えば、仮想パーソナルアシスタントを作成する際に、トランスファーラーニングは、ある領域(音楽など)のユーザの嗜好を他のもの(書籍)に一般化することができる。ユーザーはデジタル・ネイティブに限定されません。
例えば、トランスファーラーニングは、パイプラインや掘削プラットフォームなどの機器の予測保守を提供するように訓練されたAIアルゴリズムの使用を、石油やガスの生産者にも拡大する事を可能にします。
トランスファーラーニングはビジネスインテリジェンスに革命を起こす可能性もあります。航空収益を最適化する方法を理解し、天候や地方経済の変化にモデルを適応させることができるデータ分析AIツールを検討してください。
別のアプローチは、複数の問題に適用できる一般化された構造に近似するものを使用することです。
たとえば、DeepMindのAlphaZeroは、3つの異なるゲームで同じ構造を使用しています。
その一般化された構造を持つ新しいモデルを訓練して1日でチェスを学ぶことができ、その後世界チャンピオンのチェスプログラムに打ち勝つことができました。
最後に、機械学習モデルの設計を自動化しようとする新しいメタ学習技術の可能性を考えてみましょう。
たとえば、Google BrainチームはAutoMLを使用して、大規模なデータセットの画像を分類するためのニューラルネットワークの設計を自動化します。
これらの技術は現在、人間によって設計された技術と同様に機能します。
これは有望な開発です。特に、多くの組織では才能が不足し続けています。
また、メタ学習のアプローチが人間の能力を上回り、より良い結果を生み出す可能性もありますが、重要なのは、これらの技術はまだ初期段階にあるということです。
制限5:データとアルゴリズムのバイアス
これまでのところ、すでに取り上げている技術的な解決策によって克服できる限界に焦点を絞っています。
バイアスは異なる種類のチャレンジです。
使用するデータポイントと無視するデータポイントを選択する際に、人間の好み(意識しているか意識していないか)を考慮に入れると、潜在的に壊滅的な社会的影響が発生する可能性があります。
さらに、データ収集のプロセスや頻度そのものがグループ全体と観察された行動で不均一な場合、アルゴリズムがデータを分析、学習、予測を行う方法に問題が生じる事があります。
ネガティブな結果には、科学的または医学的予後を誤ったり、歪んだ財務モデルや刑罰法の決定、法定尺度上での指針を誤用をするなど誤った採用方法も含まれる場合があります。
多くの場合、これらのバイアスは「高度なデータサイエンス」、「独自のデータとアルゴリズム」、「客観的分析」のベールの元で無視されるか認識されません。
機械学習とAIアルゴリズムを新しい分野に展開するにつれて、これらの潜在的なバイアスの問題がデータセットとアルゴリズム内に潜在する例が増えるでしょう。
このようなバイアスは、それらを認識するために埋め込まれたままになる傾向があります。
それらに対処するための措置を取るためには、データ収集を含む既存の社会的勢力のメタ理解はもちろんの事、データサイエンス技術に深く精通する事が必要です。
結局のところ、今日、バイアスの削除は最も困難で社会的問題をはらむ障害の1つであることが証明されています。
現在、複数の研究努力が行われており、ベストプラクティスを捉える努力だけでなく、学術、非営利、民間部門の研究でこれらの問題に取り組んでいます。
それはあまりにも早いことではありません。なぜなら、挑戦はますます重要になる見込みで、より多くの疑問が生じるからです。
例えば、これらの機械学習と統計情報に基づく予測アプローチの多くが、未来が過去と同じであると暗黙のうちに仮定しているという事実を考慮してください。
変化を促す努力が行われている社会文化的環境や、過去の行動に基づいた意思決定が進歩を阻害する(あるいは、悪化し、変化への抵抗を生み出す)場面では、どうすればよいでしょうか?
間もなく、ビジネスリーダーを含む幅広い指導者が、このような質問に答えるために招集されるでしょう。
動いているターゲットを捉える
ここに示された制限への解決策は、多くの進歩の商業的実施の広がりに伴い、数年先に実現する事となるでしょう。
しかし、AI採用による息をのむほどの可能性の広がりは、AIの最大の制約は想像力であるかもしれないことを示唆しています。
ここに先進的な努力をしているリーダー(少なくともあまりにも遅れていない)にとっての幾つかの提案があります。
宿題,校正,ついていく
ほとんどの役員は、畳み込みニューラルネットワークと再帰型ニューラルネットワークの違いを知る必要はありませんが、今日のツールの機能については一般的な知識、短期的な進歩が起こる可能性があるという感覚や地平線を超えた先のものに対する視点が必要です。
データサイエンスや機械学習のエキスパートをメンバーとして選出しましょう。
AI開拓者と話し合って校正を受け、AIカンファレンスに参加したりするのもいいでしょう。事実を知るための2つのポイントとして、報道機関が役立つこともありますが、誇大宣言マシンの一部かもしれない事に留意が必要です。
AIの索引(スタンフォードに本拠を置く100年の人工知能研究プロジェクト)など有識者による継続的な追跡調査は最新情報に追いつく為に役立つもう一つの方法です。
洗練されたデータ戦略の採用
AIアルゴリズムには、システムが生成するデータに潜む貴重な洞察を解くための支援が必要です。
異種システムのデータをプールするために必要なテクノロジだけでなく、データの可用性と取得、データラベリング、データガバナンスにも焦点を当てた包括的なデータ戦略を策定することによって、支援することができます。
より新しい技術は、AIアルゴリズムのトレーニングに必要なデータ量を削減することを約束していますが、今日ではデータが必要な教師あり学習が最も一般的な手法です。
また、必要なデータの量を最小限に抑えることを目的とする技術さえ、依然としていくつかのデータが必要です。
したがって、これの重要な部分は、独自のデータポイントとその活用方法を十分に理解していることです。
横に考えよう
転移学習の技術は未だに未熟ですが、複数の分野でAIソリューションを活用する方法があります。
大規模な倉庫設備の予測保守などの問題を解決する場合は、同じソリューションをコンシューマー製品にも適用できるでしょうか?
効果的な次の製品購入ソリューションを複数の流通チャネルで使用できますか?
各事業部門に対して、最高のAIソリューションの利用方法を分かりやすく知識として共有し、自社の複数の分野で考えることをお勧めします。
先駆者になろう
今日のAI技術やユースケースに追いつくだけでは、長期的に競争力を維持するには十分ではありません。
データサイエンスのスタッフやパートナーと外部の専門家を結びつけて、この記事で説明したような画期的な技術を用いて、インパクトのあるユースケースを解決してください。
さらに、何が可能で、何が入手可能であるかを知らせてください。
多くの(音声、視覚、感情の検出を含む)機械学習ツール、データセット、標準アプリケーション用の訓練されたモデルが広く利用されています。
時にはオープンソースになる場合もあれば、先駆的な研究者や企業によって作成されたアプリケーションプログラミングインターフェイス(API)を使用する場合もあります。
ファーストムーバーやアーリーアダプターの優位性を賭けるというあなたの可能性を高めるために、このような可能性に注目してください。
AIの約束は巨大であり、その約束を果たすために必要な技術、ツール、プロセスは完全には到着していません。
技術を発展させ、成功した高速フォロワーになれると思ったら、もう一度考えてみてください。
立ち上がりから飛び跳ねる事は難しいですが、特にターゲットが急激に動いているときに、AIツールができる事とできない事を理解していない時は特にそうです。
研究者とAI先駆者が今日の最も厄介な問題の解決の為の体制を整えているので、AIフロンティアで何が起きているのかを理解する時が来ています。
そして、あなたの組織で学び、開拓し、新たな可能性を進化させることさえあるでしょう。