More than 5 years have passed since last update.

株式会社キカガク

「ＡＩで〇〇したいんだけど」の相談前に確認してほしい３つのこと

Posted at 2018-11-21

はじめに

みなさん、こんにちは。
株式会社キカガクの代表取締役の吉崎です。

今回のテーマは「ＡＩで〇〇したいんだけど」という相談についてです。

１か月ほど前に書いた「機械学習を使った事業を成功させるために必要な考え方や人材、フェーズとは？」という記事に多くのいいねをいただき、このあたりの内容にご納得いただけたようで、とても嬉しいです。

そして、今回のテーマで扱う「ＡＩで〇〇したいんだけど」という相談について一概に否定するわけではないのですが、基本的には何もわからないからとりあえず話を聞かせてほしいという文脈の相談が多く、こちらとしても解析に使う時間などを削って相談に乗っているので、何もないと何の時間だったの...と思うわけです。

そこで、今回は１人分の相談に乗れる時間を使って、こういったことをすでにクリアしているのであれば、さらに相談すると実りがありますよという線引きをしておきたいと思います。

それでは、私が感じる相談前に確認してほしい３つのことは以下の通りです。

人間を超えるＡＩという幻想を抱いていないか
ＡＩなしでもビジネスが成り立っているか
必要なデータの形を知っているか

人間を超えるＡＩという幻想を抱いていないか

この相談内容でよくあるものとして、人間にはできていないから、人間を超えると言われているＡＩで解決したいということがあります。
確かに、AlphaGoでは囲碁で人間に勝ちましたし、最近では人間を超える結果を残すＡＩも登場しています。

ただし、これは限られた環境の中での話であって、すべての状況においてＡＩが人間を超えているわけではありません。

ＡＩには汎用型ＡＩと特化型ＡＩがあります。
前者はドラえもんのように人間から与えられた情報を収集しながら処理を行い、その情報をもとに成長していくような人間にとって理想的な存在のＡＩです。
そして、後者は人間が与えた教師データをもとに、その手順を限られた環境下で再現できるような規則性を見つけるようなＡＩです。

ビジネスの現場で使われているＡＩはほとんどが特化型ＡＩです。
この特化型ＡＩでは人間が与える教師データを答えとして学習するため、基本的には人間を超えることはありません。
処理速度などという観点では人間を超えることはあるのですが、回答の質という意味では模倣するだけであるため、人間と同じ性能が出せれば万歳というものです。

またＡＩでは学習と推論の工程がありますが、これを知らない人を今でもよく見かけます。

学習では、人間が与えた教師データに基づいてその規則性を見つけていきます（教師なし学習というものもありますが、ひとまず置いておきましょう）。
この例でいうならば、与えられた画像が「佐藤さん」か「鈴木さん」かを分類するのですが、ＡＩでは最初からこれが佐藤さんか鈴木さんか知っているはずもないので、これは人間が教師データとして手作業で準備する必要があります。

そして、学習を終えてある程度良い精度で予測できるような学習済みモデルが出来上がれば、これを用いて推論を行うことができます。

サービスで使っていく場合にはもちろん推論の工程から活用が開始できるのですが、ＡＩは最初から学習なしでも推論から始められると思っている人が意外と多いのです。

こんな話をするとないないと思うかもしれませんが、
即導入できるチャットボットが欲しい
という要望を聞いたりすることがあり、まさにこの例です。

ＡＩを作る場合は部下を育てるようにとよく言うのですが、まずは教師データを作りながら、根気強く人間がＡＩに教え込んでいく必要があります。
「なんだＡＩってそんなものか」
そう思った方は、ＡＩを使わずにビジネスを成り立たせることをお勧めします。

ただし、AzureのCognitive Servicesなどで提供されているのですが、学習済みモデルが提供されており、提供されている限られた用途でよければ、推論から始めることもできます。
ＡＩ初心者の方にはまず使ってみるという点で、このような学習済みモデルを使ってサービスに活かせないかというところから調べてみましょう。

Azure Cognitive Services
IBM Watson
GCP Cloud Visionなど

ＡＩなしでもビジネスが成り立っているか

こちらに関しては、前回の記事でも大きく触れているところでした。
参考：機械学習を使った事業を成功させるために必要な考え方や人材、フェーズとは？

詳しくは上記の記事を読んでほしいのですが、ＡＩありきでないと成立しないビジネスモデルを成り立たせることは苦労すべき点が多いです。
ＡＩに関して知見のある人が取り組んでもビジネスとして成り立たないことが多いということは、ＡＩに関してほとんど知らない人が成り立たせることはさらなる難しさがあるわけです。

上記の記事で紹介しているパターンＡのビジネスモデルとなれるように考え、そして、精度100%が出ない場合での運用側のカバーを考えてみてください。
ＡＩの活用はその点でのアイディアが見えていて、はじめてスタート地点に立てるはずです。

必要なデータの形を知っているか

ＡＩと一言で言っても、ほとんどの場合は機械学習を指していると思います。
そして、この機械学習はありとあらゆるものをなんかいい感じの結果を得られるブラックボックスではなく、決められた入力から決められた結果が得られる程度のものです。
そのため、すでに用意されている状況下でしかパフォーマンスを出すことができません。

この機械学習を活用したいという場合には、どのような手法があり、その手法を使うためにはどのようなデータの形をしておかないといけないかを覚えておきましょう。
その手法や形を覚えておくために、ここではいくつかの代表的なものを紹介していきます。
さらに詳しくは下記の本などがおすすめです。

参考文献：大学4年間のデータサイエンスが10時間でざっと学べる

教師あり学習

ビジネス活用されている代表的なものが教師あり学習と呼ばれる入力となる変数と教師データとの関係性（規則性）を見つけて、その規則性に基づいて新しいサンプルに対する予測をおこなうものです。
そのためには以下のようなデータの構造になっている必要があります。

「データは大量にあるんだけど」という相談も多いのですが、たいていのケースは入力変数となるデータが溜まっているだけであり、教師データと紐づけて蓄積されていることがありません。

教師なし学習

教師なし学習ではマーケティングによく使われるクラスタリングを代表的なものとして、入力となるデータだけで学習を行います。

教師データのように答えのない中、何を予測するの？と思うかもしれませんが、たとえばクラスタリングの例でみてみましょう。

クラスタリングでは上図のように、データが存在している中でどのようにグルーピングすると適切であるかと考えて、それを学習していきます。

距離情報（遠い近いを定量評価）に基づいてクラスターと呼ばれる塊を作ります。上記ではわかりやすいように丸で囲んでいますが、厳密には丸と丸の間のゾーンに新しいサンプルが来た場合には一番近いクラスターに割り当てられます。
また、今回はクラスターの数を３としていますが、答えがないため適切なクラスターの数はわかりません。
データを見ながら、またＡＩＣなどのいくつかの指標を見ながら適切だと考えられるクラスターの数を決めていきます。

そして、クラスターという単位でくくることができれば、おそらくこの同一クラスター内の人物は似ているだろうという仮説のもと、それぞれのクラスターに対する施策を打つマーケティングが行われるわけです。
この先の姿としてパーソナライズされたレコメンドがあります。

たしかに教師データはありませんでしたが、なんの根拠もなくマーケティングするよりは一歩進みそうな気配がします。
これが教師なし学習と呼ばれるものです。

レコメンド

マーケティングの次の施策として登場していたレコメンドは各個人の単位でおすすめの商品などを予測して提案するものです。
Amazonのおすすめの商品など最近ではとても身近な存在になっていると思います。
このレコメンドに関する相談も多くあります。

レコメンドの際には上記のようなデータ構造のデータセットが必要となります。
あるユーザーにお勧めの商品を提示する場合には、過去のどのユーザーがどのアイテムに対して何点をつけていたかという点数 (rating) が必要です。
それ以外にも、ユーザーやアイテムの属性情報などからレコメンドを行うこともできますが、それはさらに発展形としてここでは置いておきましょう。

レコメンドでは点数がつけられており、その点数情報を教師データとして学習するため、教師あり学習のように受け取ることもできますし、内部で属性情報が似たユーザーという距離情報に基づいたアルゴリズムも含まれるため、教師ありと教師なしの両方を駆使したものだと思っています。
そのため、別の枠組みで紹介していました。

ツールで簡単に実装できる時代

これまで回帰や分類の教師あり学習、クラスタリングなどの教師なし学習、レコメンドと紹介してきましたが、それではこれらのデータの構造を理解し、蓄積ができていても難しいプログラミングが次の壁として待っているのでしょうか。
それが、最近では、ツールを使って簡単に機械学習のモデルを構築できる時代になっており、たとえば、Azure Machine Learning Studioでは下記に示すように、GUIでポチポチと組んでいくだけでノンプログラミングで実装ができます。