データドリブン企業への変換、これは、意味のあるビジネス成果をドライブするために、企業の全ての側面にデータが浸透することが重要となることを意味します。様々な業界の企業においては、変化し続けるコンプライアンス基準をクリアしながらも、顧客の要求に追従し、イノベーションを起こし続けることフォーカスをすることになり、データリテラシーという新たなバズワードが生まれました。高度に訓練されたデータエンジニア、データサイエンティスト、MLエンジニアの大規模チームが存在しない企業においても、データアセットの構築、実運用が求められていますが...スケールするものではありません。
このような状況を受け、我々はシチズンデータサイエンティスト向けのノーコードデータ分析ツールであるbamboolibを提供しているフランクフルトベースのスタートアップである8080 Labsの買収を発表できることを嬉しく思います。なぜ我々がこれほど興奮しているのでしょうか?これは、イノベーションに至る道筋を開くために、より広い範囲のデータ実践者、データに熱意を持つ人を支援するための、ローコード/ノーコードの領域に進出するという我々の戦略です。我々は、より多くの人がデータとAIのパワーを活用できるようにし続けており、これは、使いやすいダッシュボード、可視化機能を提供するための以前のRedashの買収に続くものとなります。
bamboolibは、ユーザーによるコーディングなしに、高速かつシンプルなデータ探索、変換を行うためのPythonコードをエクスポートできる拡張可能なGUIを提供します。UIベースのワークフローは、シチズンデータサイエンティストとエキスパートの両方が容易にDatabricksにアクセスできるようにし、従業員のオンボーディング、トレーニングのコストを削減します。ノーコードのユースケースには以下のようなものがあります。
データ準備 後段のユースケースで使用できるようにするために、数クリックで生データをクリーンかつ構造化されたものにすることができます。
データ変換 UIから直接、複雑なデータセットを簡単に集計、変換することができます。
データの可視化 Plotlyによるプロットを迅速に作成、エクスポートでき、10倍高速なデータの可視化を活用できます。
データ探索 Explore DataFrame機能を用いてデータ探索を数分で。
今後のロードマップにおいては、Databricksレイクハウスプラットフォームにbamboolibのノーコード機能をインテグレーションする予定です。
ローコード/ノーコードによるシチズンデータサイエンティストのサポート
ビジネスインパクトを生み出すために、(技術チームに限らず)誰もがデータとAIを活用したいと考えています。このことが、議論や重要な機能にデータドリブンの洞察を提供することができる人すべてを指す、シチズンデータサイエンティストを生み出しました。彼らはいかなる組織、地位にも存在し、彼らの企業と、データサイエンスチーム、(存在するのであれば)機械学習チームの間の橋渡しを支援しています。
技術的な現実として、シチズンデータサイエンティスト向けツールは、簡単なデータ探索はサポートしていますが、それ以外はほとんどサポートしていません。MLユースケースを実行するには依然としてエンジニアリングリソースが必要です。そうではなく、企業が求めているのは、参入障壁を下げることで、MLモデルを構築し、本格運用するために必要となる専門性を民主化するソリューションなのです。
新たなアプローチによるデータ + AIアクセシビリティの拡張
我々はこのジレンマを、シチズンデータサイエンティストが一行もコードを書くことなしに、インパクトのあるデータサイエンスやAIユースケースを実行できるようにするユニークなアプローチで解決します。データに熱意を持つ人がクイックに大規模MLモデルを構築し、デプロイすることを支援するために、前処理、特徴量エンジニアリング、モデルトレーニング、モデルチューニングの負荷を自動化によって取り除くDatabricks AutoMLを今年の初めにリリースしており、すでにこのような取り組みを進めています。AutoMLは完全に編集可能なノートブックによるベースラインモデルを生成しますので、シチズンデータサイエンティストはクイックに有用な結果を得ることができます。bamboolibとDatabricks AutoMLは共に、企業内の誰もがデータを準備し、テクニカルエキスパートに頼ることなしに、データ分析やMLのような後段のユースケースを実行できるようにします。
次に来るのは?
我々は共同創始者である、Florian WetschoreckとTobias KrabelをDatabricksチームに迎えることができることを嬉しく思っており、EMEA地域での採用を加速しています。
bamboolib機能のDatabricksレイクハウスプラットフォームへのインテグレーションは2022年初頭を予定していますので、ソリューションにディープダイブする今後の記事を楽しみにしていてください。