コラボレーションは、データサイエンスを成功させるための不可欠な要素ですが、世界的なコロナ危機によって世界中のデータチームの力関係が急速に変化し、瞬く間に遠隔地でのデータサイエンスプロジェクト(進行中のものも、まだ始まっていないものも)の運営を余儀なくされたことで、この概念が注目を浴びるようになりました。
→「データ+AIの活用を仕組み化する」完全版のEBOOK(英語)を入手する
本ブログでは、仕組み化がデータサイエンスのコラボレーションの未来である理由と、チームが仕組み化に取り組まなければ後れを取るリスクがある理由をいくつか紹介します。
仕組み化は新しい常識である(そして、AIの成熟度を高めるためには不可欠な要素)
データとAIの利用を仕組み化することとは、あらゆる場所、あらゆる人にデータとAIを浸透させ、プロセスとテクノロジーが深く浸透して、組織のあらゆる部分がそれに基づいて目標を達成するようにすることです。組織は、データ、分析、AIのプロセスや能力において、コラボレーティブ・データ・サイエンスにとどまっていては、このような広く、深いレベルを達成することはできません。コラボレーティブなデータサイエンスとは、次のことを意味します。
- データサイエンスのワークフロー全体での調整。これは、従来のデータサイエンスの生データ→モデリング→インサイトのプロセスから外れたワークフロー(セルフサービス型のアナリティクスや従来のビジネスインテリジェンスなど)を省くことを意味します。
- データサイエンスの生産性とアジリティの向上:中核となるデータサイエンスチームは有効ですが、一般ユーザは対象外となります。
- データサイエンティストやエンジニアのような技術者間のプロセスを円滑にする。これは有用だが、最終的にはアナリストやビジネスの主題専門家のような非技術者を含める必要がある。
データサイエンスのコラボレーションは、誰もがそれぞれの才能を発揮してデータプロジェクトに貢献できる良い出発点ですが、チームが結果を出すためには、それを基にしてさらなる仕組みを構築する必要があります。データサイエンティストなどの中心的なチームがAIを利用したり開発したりするのではなく、AIがビジネスの一部となるように、日々の業務に深く浸透させ、絡み合わせていく必要があります。仕組み化に欠かせないのがAIオーグメンテーション、つまり人とAI技術が連携してパフォーマンスを高めることです。10台のモデルから1,000台のモデルに移行するためには、仕組み化が、より多くの人にAIを使ってもらうためのデファクトとなります。
コラボレーションプラットフォームとの連携以上が必要
私たちは、チームのAIプラットフォームが、現在のテクノロジー(プログラミング言語、バージョン管理のためのGit、機械学習モデルライブラリなど)と簡単に統合できないべきだと言っているわけではありませんし、逆にそうすべきと考えています。また、SlackやMicrosoft Teamsのような他のコラボレーションプラットフォームとも簡単に連携できるようにすべきです。
しかし、それだけではありません。それは、モデル開発が始まる前から、データサイエンスチームと意思決定者の間で組織的な調整が行われているかどうかということです(つまり、ビジネスの問題は、ビジネスエキスパートとデータサイエンティストが一緒に解決するのに、現実的/実現可能なものなのか?価値への明確な道筋があるのか?リスクはどのようなものか?データプロジェクトの後、ビジネスはプロセスや結果の測定にどのような変更を加えるのか?) このようにすることで、データチームはモデルの結果が採用され、ビジネスに具体的な影響を与え始めることを保証することができます。さらに、目に見えないメリットとして、主要なステークホルダーがAIプロジェクトに取り組むチームに自信と信頼を抱くようになります。
それはもはや必須要件である
仕組み化は未来の課題であり、特に生産性や部門を超えたコラボレーションを実践する上で重要です。ここでは、機能していないコラボレーションの実践がどのような形で現れるか、いくつかの例を紹介します(全リストはEBOOKでご確認ください)。
- チーム内やチーム間での実際のコミュニケーション不足を補うために、コミュニケーション素材の構築に時間をかけすぎている。その結果、業務やビジネスに影響を与えるような内容に費やす時間が少なくなる。
- 適切なデータやアナリティクスの資産を探すのに相当な時間が費やされている(例:「最新の年度分析を誰が行ったか覚えていますか?」)。
- プロジェクトを本番に移行する際に、ビジネスサイドからの文書や関係者がいないため、ギャップが生じる。
あなたにとってのメリットは?
ここまでの内容に納得しているかもしれませんが、なぜ仕組み化した方が、私や私の担当者にとって良いのだろう、と思われるかもしれません。
これまで述べてきたように、データサイエンスのコラボレーションは不可欠ですが、それは全体(データとAIの仕組み化を意味する)のごく一部です。データサイエンスにおけるコラボレーションは、どこにでもあるものではなく、プロジェクトに参加する前にチームで話し合い、計画を立てるべきものです。ここでは、仕組み化が組織にとって意味があるかどうかを判断する際に、自問するべき質問を紹介します。
- コラボレーション自体は技術者間のプロセスを円滑にするものですが、アナリストやその他の非技術者もそれに参加する必要があるのではないでしょうか?
- データサイエンスのワークフロー全体の調整は素晴らしいことですが、セルフサービス・アナリティクスや従来のビジネス・インテリジェンスなど、他のアナリティクス・プロセスも役割を果たすべきではないでしょうか?
- データ・サイエンス・チームやセンター・オブ・エクセレンス以外の人々にも、データを使って生産的かつアジャイルに行動できるようにする責任があると思いますか?
- さまざまなチームのメンバーが、議論やデータプロジェクトのための単一の場所を持てば、生産性が向上すると思いますか?
- チームがデータプロジェクトから得たインサイトを、カスタムダッシュボードやアプリを使って他のユーザーやビジネス関係者に公開・共有できることが重要だと思いますか?
上記のすべてに「はい」と答えた方は、仕組み化が唯一の道です。
結局のところ、すべてのチーム、プロセス、ツールにコラボレーションがしっかりと組み込まれていないと、組織の欠陥や生産性へ影響があります。アナリティクスとAIのコラボレーションに関して、組織がどの段階にあるかによって成熟度は異なりますが、仕組み化は、ワークフローの合理化、インサイトの共有、レベルの高いアジリティの追加、時間の節約を確実にするためには譲れないものです。
**データとAIの活用を仕組み化する唯一のプラットフォーム「Dataiku」の理由を見る** コラボレーション型のデータサイエンスを超える時が来ました。このEBOOKでは、組織が成功するためにDataikuのようなプラットフォームを使ってデータとAIの取り組みを仕組み化する必要がある理由について学びます。 →EBOOK(英語)のダウンロードは[こちら](https://pages.dataiku.com/systemization-data-ai)
原文:[Why the Conversation Is Shifting From Collaborative Data Science to Systemization](https://blog.dataiku.com/ai-systemization)