シャドーアナリティクス(統制された IT 環境の外で行われる分析)は、ITチームにとって依然として最大の盲点のひとつです。 シャドー ITと呼ばれようが、分散型の意思決定と呼ばれようが、結果は同じです。重複するデータ、散在するワークフロー、コンプライアンスとセキュリティを危険にさらす監視の欠如をもらたします。
このブログでは、DataikuがアナリティクスとAIのためのセキュアで統制されたスケーラブルなプラットフォームを提供することで、IT部門がイノベーションを減速させることなくシャドーアナリティクスを排除する方法をご紹介します。 最近のウェビナーで、Dataikuのソリューションエンジニアであるコーディ ブルックスは、これが実際にどのように機能するかをデモで紹介しました。
→ Webinar動画を閲覧する
典型的なカスタマージャーニー
典型的なアナリティクスの旅は、多くの場合、善意から始まります。 コーディがウェビナーで説明したように、アナリティクスの近代化を目指す組織は通常、Alteryxのようなデスクトップツールの採用から始めます。 これらのツールはセルフサービス機能を提供し、データ管理やスプレッドシートの自動化のようなタスクを実現します。
迅速なオンボーディング、スプレッドシートの自動化、ビジネスユーザーによる早期の価値提供など、その魅力は理解できます。 しかし、導入が広がるにつれ、課題も増えてきます。チームは結局、デスクトップ上の孤立したワークフロー、重複したデータセット、クラウドへのアクセスが制限されている状態、最小範囲の監視という問題を抱えることになります。この時点でIT部門は、ガバナンスとスケーラビリティを欠いた断片的なエコシステムと格闘することになるのです。
Dataikuがゲームチェンジャーとなるのはまさにここです。Dataikuは、孤立したワークフローをつなぎ合わせるのではなく、一元管理されたコラボレーションプラットフォームを提供し、 ITチームとビジネスチームが同期し、責任を持ってアナリティクスを拡張できるようにします。
ユニバーサルAIプラットフォーム™の4つの柱
Dataikuは、4つの主要な柱を通して、データユーザーとITの調和をもたらすように設計されています:
- People(人々): Dataikuはコーダーだけのものではありません。 Dataikuは、コードファーストのユーザーとノーコードのユーザーの両方をサポートし、ビジネスアナリスト、エンジニア、データサイエンティストが単一のワークスペースでコラボレーションできるようにします
- Data(データ) :Dataikuを使えば、1つの環境に縛られることはありません。 オンプレミスまたはクラウドで、構造化および非構造化データに接続し、複数の計算エンジンで実行します
- Governance(ガバナンス): AIの導入が進むにつれ、リスクとコンプライアンスに関する懸念も高まっています。 Dataikuは、ガバナンスをデータからAIへのライフサイクル全体に組み込むことで、データの準備から展開に至るまで、IT部門に可視性と制御を提供します
- Tech Optionality(技術の選択肢):ベンダーロックインはありません。 Dataikuは、あらゆるクラウドプロバイダー、データスタック、オープンソースツール、大規模言語モデルと統合することができます
エンタープライズAIワークフローのセントラルハブ
Dataikuは、アナリティクスとAIのワークフローを1つのプラットフォームで全面的にサポートします。 チームは、コードまたはローコードツールを使用してAIを実験し、組み込みのCI/CDとモニタリングでデプロイし、APIとBIツールを介してビジネスアプリケーションに直接洞察を統合することができます。 IT にとって、これは、運用を混乱させることなく、デプロイ、オーケストレーション、統合を一元化することを意味します。
このプラットフォームのモジュール式アーキテクチャには、パイプラインとモデルを構築する Design Node、生産ワークフローを管理する Deployer、スケジュールされた実行を行う Automation Nodeおよびリアルタイムの予測を行う API Node が含まれます。 重要なのは、Govern Node (いわばコントロールタワー) が統合し、AIのライフサイクルのすべての段階にわたって完全なトレーサビリティ、監査可能性、コンプライアンスを提供することです。
あなたと同じスピードで動くガバナンス
ITリーダーは、AIプロジェクトが宙ぶらりんになったり、適切なレビューなしに本番稼動したりすることを望んでいません。 Dataikuのガバナンス機能はプラットフォームに組み込まれているため、監視は遡及的ではなくリアルタイムで行われます。
Govern Nodeは、アナリティクスとAIイニシアチブのためのDataikuの集中コントロールタワーであり、ITリーダーやエグゼクティブがプロジェクトの進捗を追跡し、リスクを評価し、コンプライアンスを実施するために必要な可視性を提供します。 設計から導入まで、ガバナンスはワークフローの一部であり、切り離されたスプレッドシートではありません。
主な特徴は以下の通り:
- チームがアナリティクスとAIプロジェクトを標準化し、不整合を減らすためにあらかじめ用意されたテンプレート
- モデルを本番環境に投入する前に影響を評価する、価値とリスクの検証フレームワーク
- 承認されていないモデルやパフォーマンスの低いモデルがデプロイされるのを防ぐ、構造化された承認ワークフロー
- パフォーマンスを監視し、責任ある反復をサポートする一元化されたモデルレジストリ
再利用性とコラボレーションをデザインが促す
多くの場合、チームはワークフローをゼロから再構築し、非効率な重複作業を招きます。Dataikuは、チームが既存のユースケース、テンプレート、ベストプラクティスを保存、共有、拡張できるようにすることで、再利用を促進します。同じようなイニシアチブを部門横断的に展開する場合でも、既存のソリューションを適応させる場合でも、チームはやり直すことなく、過去の作業をベースにすることができます。
シームレスなクラウドアクセスでAIを強化
さらに、Dataikuはクラウドインフラストラクチャとネイティブに統合され、スケーラビリティ、パフォーマンス、ガバナンスを同等に保証します。 ITチームとビジネスチームは、厳格なガバナンスを維持しながら、コンピューティングとデータストレージのクラウドサービスにフルアクセスし、アナリティクスとAIでリアルタイムにコラボレーションすることができます。
デモ: AIワークフローの診断、修正、管理 - すべてを1か所で実現
次に Cody 氏は、IT 部門が管理されたエンドツーエンドのワークフローで、データ パイプラインのエラーを検出、調査、解決する方法をライブ デモで説明しています。 (ツールを切り替えたり、手作業に頼ったりすることなく。)
ウォークスルーからご覧になりたい場合は、動画の11:25から再生ください。
このシナリオは、一般的なITの課題である、本番稼動時に実行の失敗を引き起こしていた、繰り返し発生するデータ品質の問題から始まっています。Dataiku Launchpad(ユーザーが単一のインターフェイスですべてのノードにアクセスできるセントラルハブ )を使用して、コーディはDeployerに移動し、実行エラーのあるプロジェクトを特定しました。 彼はシナリオを検査し、データリネージュ機能を使って根本的な原因を辿り、障害がDesign Nodeのデータ品質ルールでIP値の欠落にフラグを立てていることに起因していることを確認しました。
そして、Git でバックアップされたタイムラインを使ってプロジェクトの変更を監査する方法や、組み込みのディスカッションパネルを使って、上流で問題を修正するためにデータエンジニアにタグ付けするなど、部門を超えたコラボレーションを可能にする方法を実演しました。データセットが修正されると、彼は新しいバンドルを作成し、それを Govern Node で承認のために提出し、役割に応じた承認ワークフローがどのように無許可のデプロイを防ぐかを示しました。 承認後、プロジェクトはデプロイヤー経由で再デプロイされ、自動化が再開されました。
デモでは、エンドツーエンドのノード統合、カラムのリネージュ、監査可能性、組み込みのレビュー機能、セントラルデプロイメントなど、このワークフローを可能にするDataikuのコア機能を強調しています。 — これらすべてが、DataikuのユニバーサルAIプラットフォームで実現可能です。
Dataikuでシャドーアナリティクスに終止符を打ち、企業データのコントロールを取り戻そう
ウェビナーでは、Dataikuがシャドーアナリティクスにどのような秩序をもたらし、ITリーダーにビジネスを停滞させることなく迅速なガバナンスを可能にするのかをご紹介します。
→ デモ動画を見る