LoginSignup
3
1

More than 5 years have passed since last update.

ソフトウェアとAIに飲み込まれてしまったカメラの今と将来の可能性

Posted at

image.png

私がシリコンバレーに移った2000年ころは、カメラと言えば日本、つまりキャノン、ソニー、ニコンといったかんじでしたが、今やそんな面影すらありません。すっかりAppleかGoogleという時代になってしまいました。

これはカメラがソフトウェアに飲み込まれてしまったからですが(少なくとも一般消費者にとっては。)、現在ソフトウェアの中でも特にAIのレイヤーによって、カメラはこれからもさらに進化していくことが期待されています。

この10年ほどは、「Software is eathing the world(ソフトウェアが世界を食べる)」という言葉がよく使われていましたが、現在はすっかり「AI is eathing the world(AIが世界を食べる)」という時代になったようです。こうしたトレンドをわかりやすいかたちで見ることができるのがカメラの世界です。

今日は、私のWeekly UpdateでもおなじみのBen Evans(A16Zというシリコンバレーのトップクラスのベンチャー・キャピタルのアナリスト)による、このトレンドの今、そしてこれから将来どうなっていくのかについての考察、”Cameras that understand: portrait mode and Google Lens”がおもしろかったので、ここで要約というかたちで紹介します。


カメラの進化とはソフトウェア、そしてAIである

Benは現在一般消費者が手にするカメラの世界で起きている進化とはソフトウェアによるものだといいます。そして今日ソフトウェアといえば、それはAIが大きな役割を果たしていることになります。


AppleとGoogleの両方に言えることだが、スマホのカメラのほとんどの進化というのは今やソフトウェアのレベルで起きていることだ。

マーケティングの世界では「コンピュテーショナル・フォトグラフィー」と言われているものだが、ようはレンズとセンサーをよりよく使うと同時に、(ところでこれらは電話のサイズと物理の法則に制限される)ソフトウェアを使って、(といっても今日においてはそのほとんど意味するところは機械学習またはAIということだが)ハードウェアから送られてくる生のデータからより良い写真を生成するということだ。

Appleはデュアルレンズ・システムを持ったiPhoneに「ポートレート・モード」をリリースしたのだが、ソフトウェアを使ってデータをシングル・リフォーカスした画像として生成していたのですが、今やシングルレンズを搭載しているiPhoneでもサポートしています。(Googleもこの機能をパクって同じことができるようになりました。)

image.png


同じように、Googleの新しいPixelという電話機では「夜景モード」の機能がありますが、これはすべてソフトウェアによるもので、ハードウェアが特に優れているというわけではない。写真の技術的な品質が上がっているのは新しいソフトウェアのおかげであって、新しいハードウェアのおかげではない。

image.png

さらにこのソフトウェアとAIによるカメラの技術的な進化はまだとどまることはなさそうです。

カメラが、あなたが実際には何を写真にとっているのかがわかるようになるかもしれない。あなたがスキー場で写真を撮っている時、カメラが雪がバックグランドにあるということで自動的に調整してくれることで光や色の調整を完璧に行ってくれるようになる。こんにちは、ポートレート・モードは顔認識をし、さらに深さを認識することで自動的に何にフォーカスを当てればいいかを識別してくれる。将来的には、カメラの中のどの顔があなたの子供なのかがわかるようになり、彼らに自動的にフォーカスするようになるだろう。

つまり、現在のソフトウェアの進化によって、「普通の人でも技術的には完璧な写真が撮れるようになる」という方向に向かっているわけです。

ここまでは、「Software is eating the world」というトレンドを理解している人たちにとってはある意味当たり前のことをまとめているようですが、ここで止まることのないのが、Benらしいところです。

写真を撮った人の意図を読み取ることができるようになると

彼は次のステップとして、写真の中にあるのは「何」なのかを認識するだけではなく、あなたが「なぜ」この写真を撮ったのかということを推測することができるようになる、そうするともっと可能性が開けるのでは、と問いかけます。


スマホのカメラに対する期待は、いつも手に持っているのでただで制限なく好きなだけ写真を取ることができ、いつでも手にすることができます。ということは、自分たちの子供や犬の写真だけでなく、昔であれば撮ることはなかったようなものまで撮ることができる。ポスターや本や買いたい物、レシピ、カタログ、カンファレンスのスケジュール、電車の時刻表、フライヤーなどです。スマホのイメージセンサーはノートブックになったのです。

みなさんもよくあることだと思いますが、例えば街角でショッピンをしている時に写真を撮ってメモ代わりにするということがあるのではないでしょうか。これは写真に撮ったものを後でオンライン(Amazonなど)で注文したいということがあるのではないでしょうか。

たまたま手にとった雑誌を見ている時に気に入ったレシピがあれば写真に撮り、あとで見返して、将来料理する時に使いたいかもしれません。

また、セミナーやミーティングなんかでもスライドを写真にとることがありますが、それはそこにかかれてあることを書き留めたいからかもしれませんし、またはそれを後でオンラインでもっと詳しく調べたいからかもしれません。

機械学習を使えるということは、こういう裏にある人間の意図を予測して、それをもとに次のアクションを取ってくれることが可能になります。

つまり写真を取れば、そのままAmazonのショッピングリストを出してくれたり、レシピやスライドの内容を文字に起こして、見やすい形でまとめてくれたり、似たようなものをレコメンドしてくれたり、などと可能性はたくさん広がります。

GoogleもAmazonもFacebookにしても、消費者の一番最初のタッチポイントになることを求めています。そうすることでより消費者を理解することができ、そのことがもちろん広告ビジネスには役立ちますし、サービスの改善にも役立ちます。それが昔はPCであり、ウェブブラウザであり、モバイルであり、検索ウィンドウであり、AlexaやGoogle Homeのような音声であったわけですが、これからはカメラというのがより重要なインプットとなってくる、これがGoogleがカメラに力をいれている理由でしょう。

カメラのAIの可能性と、消費者の期待

ただ、もちろんこれはそんなに単純なことではありません。

使う人の意図を理解するというのは、SF映画ほど簡単に現在のAIができることではありません。本のカバーの写真を撮ってそれとマッチしたものをAmazonのサイトで表示することくらいはできるでしょう。

しかし、スライドの写真を撮った時に、そこに書かれてある内容のメモが取りたかったのか、そこに使われているデザインを残しておきたかったのでしょうか。

何かのプロダクトの写真を撮った時に、それが何かということを識別できなかったり、間違っていた場合はどうするのでしょうか。

さらにその意図、つまりそのプロダクトを買いたいのか、後でスライドなどに使いたいのか、他の人と共有したいのか、ということを間違って認識してしまった場合は、どうでしょうか。

こうした間違いが何度か続くとそのアプリを使い続けたいと思うでしょうか。


こうした質問はブランドに関する質問です。Shazaamは録音された音楽だけに答えてくれるということを私達は知っています。Amazonのアプリはクルシチョフの本をマッチするのはよくできているが、最近の再販されたバージョンの本へのリンクでなく、古本へのリンクとなっていました。

また本以外では、例えばランプと花瓶などの認識は全くだめでした。その両方がAmazonでセールをやっていたというのにです。ということは、Amazonに対しては違う期待を持ったほうがいいのでしょうか。

そもそも私達はAIにどのくらいの知能を期待したらいいのでしょう。

Benはこの問題をAppleのSiriの問題に重ね合わせます。

AppleのSiriの問題は、Appleのマーケティングがどんな質問にも答えられるというような印象を植え付けてしまったことだ。消費者の期待とプロダクトができることとの間にギャップがあるのだ。

AIに対する期待のコミュニケーション

AIに対する期待の設定。ついついAIを理解していない、特にトップレベルの人間になればなるほど大きな約束をしてしまうものです。世界初だとか、世界一だとか、何でも出きるだとか、言いたがるものです。

こうして一般の人達の期待は膨れ上がってしまうので、今度は達成できないレベルの期待が満たされないと、一気に失望に変わってしまい、二度と使わないということになってしまいます。

しかし、しっかりと期待を現実的なレベルに設定しておけば、思ったよりできるな、こういうときに使えるな、という文脈で消費者は捉えることができ、使い続けることができたりするものです。

こうした、AIに対する期待を現実的に設定し、消費者やユーザーにしっかりと説明できるコミュニケーション能力というのは、ビジネスリーダー、プロダクト・オーナー、マーケター、営業といった人たちには、これからどんどん求められてくると思います。

もちろん、何もそのためにAIの専門家になる必要もなければ、裏のアルゴリズムの理論まで理解している必要があると言っているのではありません。AIを適当に理解するのではなく、AIによって可能なこと、可能でないこと、AIの限界、リスク、不確定要素、などといったことをしっかりと抑えておく必要があるということです。

終わり。


以下、告知です!

セールス・アナリティクス・セミナー開催

この3月13日(水)に、ビジネスの問題をデータサイエンスを使って解決していくためのフレームワークであるアナリティカル・シンキングと、それをセールス・マーケティングの分野に適応したユースケースの紹介を兼ねたセミナーを行います。

セールスやマーケティング分野でデータや統計・機械学習を使っていきたいと思っている方はぜひ参加を検討してみてください。詳しい情報はこちらのホームページにあります!

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1