機械学習
MachineLearning
データ分析
AI
データサイエンス

データサイエンスのすゝめ — シリコンバレーに全てを飲み込まれる前に

image.png

こんにちは、プログラミングなしでよりたくさんの人がデータサイエンスを簡単に使えるようにするために、シリコンバレーでExploratoryというプロダクトを作ってる西田(Kan Nishida)です。今日は現在進行中のデータ・AIというステージに移ったソフトウェア革命の波を日本企業にとってのチャンスととらえて、どう攻めていくことができるかについて書いてみたので、ぜひ読んでみてください。


最近久しぶりに仕事の関係で日本を訪れることがあったのですが、インターネット、モバイルの変革の時期を経た日本は、いよいよガラパゴスと言われていた鎖国の時代から開国へと舵をきったようです。iPhone、Android、Amazon、Facebook、Instagram、Netflix、AirBnBといった次から次へとシリコンバレーからやってくるプロダクト(製品)、サービスが普通にみんなの間に浸透しているのには驚きました。もはや一時のように日本生まれのプロダクト、サービスはシリコンバレーからやってくるものに太刀打ちできなくなってしまったかのようです。

ソフトウェアに飲み込まれる世界

image.png

実はこれは日本だけではなく世界中で起きている現象でもあります。特にこの20年ほどの間に、”Software is Eating the World”と言って、世界中でソフトウェア革命たるものが起きています。それは、主にシリコンバレーの企業が作り出すソフトウェアを基本とする製品、サービスが、インターネット、モバイルという破壊的な変革の波に乗って、既存の企業、業界を飲み込んでいってしまうというトレンドです。以下にここ10年、20年の間に起きたそういった例をまとめてみました。

image.png
image.png
image.png

こうしてみてみると、いかにシリコンバレーからやってくるソフトウェアをベースとしたプロダクト・サービスがありとあらゆるプロダクト、ビジネス、さらには企業、業界そのものを飲み込んでしまったかがわかると思います。そしてこれが近年のエレクトロニクス産業に代表される日本の経済に元気がない理由です。

データ・AIによる変革の波

そして現在、このソフトウェア革命はデータ・AIという最新のステージに移っています。Google、Facebook、 Apple、Tesla、Uber、Netlifxといったシリコンバレーのデータ先進企業が、以前インターネット、モバイルといった前段階のステージで起きたように、今度はデータ・AIを武器に既存のビジネスをすでに淘汰しはじめています。

image.png

配車サービスのUberがデータを使って競合相手の会社から運転手を効率的に奪ったり、目的地までの最適なルートをリアルタイムで計算することによってコストを最大限に抑え、さらに顧客満足度を最大にしながら、既存のタクシー、輸送業界を世界中で淘汰しつつあるのは有名な話です。

また、車といえば、現在は、Teslaのような企業が車をコンピューターのように電子化してしてしまうことでソフトウェアで制御することができるようにし、車載カメラから集める大量のデータとAIの技術を使ってさらに車の運転そのものを一気に自動化してしまおうとしています。この変革の波により、おそらく5年後には、まったく今とは違った自動車業界というものを私たちは目にすることになるのかもしれません。

image.png

また別の例では、アメリカではTV業界のアカデミー賞としてエミー賞というのがありますが、そこではNetflixやAmazonのオリジナル・コンテンツ(自主制作)が既存のCBS、Fox、HBOなどのテレビ・ケーブルネットワークを抑えてトップを占めるようになってから久しくありません。彼らは番組の制作を始める前の時点で、全てのユーザーの過去の視聴データをもとに、何が視聴者に受けるか受けないかを非常に高い精度で予測できるので、それによって確実にヒットとなるコンテンツに多大な予算を割り当てることができます。そしていざプロモーションの段階になると、ユーザーを嗜好データをもとに細かくグループ分けした上で、最適にパーソナライズされた広告をうち、的確なタイミングでレコメンドすることで、視聴される機会を増やしていきます。

image.png

このデータ・AIの時代には、その基盤とも言えるデータを集めるものが勝つのではなく、使いこなすことのできるものが勝ちます。これは経済の基盤が石油であった時代に、石油を掘り当てる人間が勝つのではなく、それを精製して消費者に届けることができた者(ロックフェラー)、そしてその上に新しいトランスポーテーションの革命を起こしていった者(フォード、GE)が圧倒的にその後の世界を支配していった歴史に似ていると思います。

image.png

そして、インターネット、モバイルの時代を通してより簡単に集めることのできるようになった大量のデータを使いこなすための手法、つまり、精製し、付加価値をつけ、さらにそこから深い洞察を効果的に得るための手法がデータサイエンスと言われるものなわけです。

現在のデータサイエンスはオープンソースの技術や機械学習のアルゴリズム等をプログラミングしながら使っていくのが主流なので、もともとソフトウェアの得意なプログラマーのたくさんいるシリコンバレーの企業に有利です。そういった会社はすでに、データサイエンスを使って新しい製品、サービスを作るだけでなく、毎日の実務にも効率的に応用することでビジネスを改善していっています。

例えば、Facebookは統計の知識のない人でも簡単に時系列データを予測することのできるアルゴリズムを開発、そして公開し、彼ら自身もこのアルゴリズムを使って、彼らのサービスを使うユーザーの数、さらにエンゲージメントの率、それによるサーバーの負荷などを予測しています。

image.png

Googleは、画像認識、スピーチ認識などのコアとなるディープラーニング(深層学習)のライブラリを開発し、公開していることでこの世界では有名ですが、それ以外にも、例えばマーケティング、広告部門の担当者が自分達の打ったキャンペーンの効果が実際にどれほどあったのかを、他の影響を取り除きながら計算するアルゴリズムを開発、公開し、それを使ってより効果的なキャンペーンを行うのに役立てています。

image.png

またシリコンバレーの勝ち上がってくるようなスタートアップはかなり早い段階からデータサイエンスのアルゴリズムを使って洗練された高度なコホート分析を行い、例えば、サインアップしたユーザーが何をするとお金を払う顧客となり、さらにどれくらいの期間、顧客でいてくれるのか、その場合の顧客一人あたりの生涯価値と言うのはどれくらいなのか、といったことを予測し、その結果をもとに製品のロードマップを描き、マーケティング戦略を練っています。

image.png

黒船が来た、剣を持って戦うのか、それとも技術を学ぶのか

現在の日本の状況は、今から160年ほど前にペリーの黒船がやってきた当時を思い起こさせます。

image.png

1853年7月、ペリーが黒船に乗って浦賀に現れた時、幕末の志士は16世紀にポルトガルから学んだ銃や、江戸時代に侍の道として稽古に励んだ刀では、目の前に現れた蒸気を動力とする軍艦や大砲をはじめとする近代兵器にはとうてい太刀打ちできないのをさっさと悟り、国を開国の方向に導きました。そして、西洋から一気に銃、大砲などの近代兵器を含め、様々なものを輸入し始めます。

しかしここで彼らに先見の明があったのは、世界中でおきている産業革命の波をのりこなすためには、輸入品によって近代化するだけではなく、最先端の技術を西洋から積極的に学ぶことによって、日本を日本人によって近代化させていくことが重要だと気づき実行に移していったことです。こうして、当時殆どの西洋以外の国が西洋諸国の植民地となっていく中で、唯一日本だけがそうした西洋諸国に自力で対抗できる程の近代化に成功することができました。

現在の日本はデータ・AIというステージに入ったソフトウェア革命の波にどんどん飲み込まれつつあります。パナソニック、ソニー、東芝などという昔からある、ものを作る企業は防戦一方ですし、消費者の方はシリコンバレーから入ってくるプロダクトやサービスを当たり前のように使っています。しかし今こそ、こうしたシリコンバレーの企業が作った完成品を”輸入”していくだけでなく、彼らが実際にそうしたプロダクト、サービスを作り出すために使っている最先端のデータサイエンスの技術や手法を、日本企業が積極的に学び、実践していくべき時ではないでしょうか?

もちろん、データサイエンスを学べと叫ぶのは簡単ですが、一般の日本企業のようにプログラミングができるソフトウェアに強い人材がシリコンバレーの企業と違って圧倒的に少ないという現状だと、データサイエンスを始めるのはハードルが高いというのも事実です。ただ幸運なことに、先に例を挙げたようなシリコンバレーのデータ先進企業が使う最先端のデータサイエンスのアルゴリズムは、どれもオープンソースとしてだれでも無料で使えるように公開されています。つまりそういったアルゴリズムを作れる、持っているいうのは競争上の優位にはならない時代なわけです。

そして、現在第3の波と言われる、そういった最先端のデータサイエンスのアルゴリズムをプログラミング無しで使うことで、ビジネス・ユーザーが主体となってデータサイエンスをやっていくというムーブメントが始まっていますし、それを支えるExploratoryのようなツールも出始めています。

もう一度言いますが、このデータ・AIの時代は、データ・AIを持っているということが強みになる時代ではありません。そうではなく、データ・AIを使いこなせるかどうか、つまりデータサイエンス力が競争上の優位を決めます。そして、データサイエンスの手法を使って実際のビジネスに役立つ有意義な情報をデータの山から効率的に取り出すには、ドメイン知識、つまり業務知識・経験と言うものが大きく役立つのです。そこで、普段ビジネス・業務に携わっている方たちがデータサイエンスの手法を使いこなせるようになることこそが、専門のデータサイエンティストだけがデータサイエンスをやっている企業に比べて、大きく競争上の優位になるわけです。

こうした機会を積極的に捉えて、ぜひ日本の企業のより多くの人たち、つまりこの記事を読んでいらっしゃるみなさんに、最先端のデータサイエンスの手法を学んでいっていただければと思います。なぜなら、みなさんこそが、幕末の志士がそうであったように、このソフトウェア革命のデータ・AIという時代に、日本企業を変革していくための原動力なのであり、日本がデータの植民地となるのを防ぐことができる最後の砦でもあるからです。シリコンバレー、または他の地域からもどんどん出てくるであろうデータ先進企業に対抗する守りも重要ですが、せっかくこうしたデータ・AIの変革の時代なわけですから、それを好機ととらえ、逆に、新しいタイプのプロダクト、サービス、ビジネスをひと昔前の日本がそうであったように、元気に世界に向けて発信していくという、攻めの準備をぜひ行なっていただければと思います。


データサイエンスを本格的に学びたい方へ

手前味噌になりますが、今年10月に、Exploratory社がシリコンバレーで行っているトレーニングプログラムを日本向けにした、データサイエンス・ブートキャンプが東京で行われます。このシリーズでは最後の開催となりますので、データサイエンスの手法を基礎から体系的に、プログラミングなしで学んでみたい方、そういった手法を日々のビジネスに活かしてみたい方はぜひこの機会に、参加を検討してみてください。こちらに詳しい情報があります。