Dataiku 11は、AI の監視とガバナンスに重点を置き、テクニカルコミュニティに影響を与え、
対象分野である専門家やビジネスプロフェッショナルの可能性を広げるなど、大きなブレークスルーをもたらしました。
新しいDataiku 11.1 へのアップデートにより、私たちは急速なイノベーションのスピードを維持しています。既存機能の改善に加えて、モデラー、ML エンジニア、アナリストなどがDataiku全体のエクスペリエンス向上を目的とする多くの新機能 (ユーザーフィードバックから生まれたものも含みます) が導入されています。
データサイエンティスト向けの機能を強化
データサイエンティストは、使い慣れたビジュアル ML フレームワーク上で時系列モデリングに追加された新しいオプションを確認することができます。
ハイパーパラメータの最適化を実行するときに、クロスバリデーション戦略に時間順序の導入が可能になりました。連続した重複しないデータフォールドにより、過去のデータでモデルがトレーニングされ、将来のデータを予測し、より正確な生産条件のモデルが保証されます。
さらに、データサイエンティストは予測モデルのモデル比較を生成できるようになります。


分類タスクをモデリングする場合、データサイエンティストは、stratified sampling オプションを使用して、フォールドが母集団全体と同じ一貫したクラスの割合を持っていることを確認し、サンプルバイアスを排除できます。
Computer Vision および MLFlow モデルの説明可能なML
Dataiku のビジュアル ML interpretability 機能は、データサイエンティストと ML エンジニアがモデルの動作をよりよく理解し、ステークホールダーに説明できるようにするのに役立ちます。
Dataiku 11.1 では、model explainability が画像分類モデルでも利用できるようになりました。これは、スコアリングされた各画像の視覚的なヒートマップ表現に変換され、モデルの予測に最も影響を与えた領域が強調表示されます。

もう 1 つの注目すべき機能は、MLFlow 統合を通じて Dataiku に外部から取り入れたモデルでも、さまざまな explainability 機能が利用可能ということです。
データサイエンティストは、部分依存関係を計算して、モデルが各変数の値によってどのように影響を受けるか確認できたり、subpopulation analysis を使用してデータのサブセットの潜在的なバイアスの追跡、個々の説明機能を活用して極端な確率を深く掘り下げたりすることが可能になりました。
これらの機能により、コーダーの労力が減り、MLFlowモデルの解釈可能性が次のレベルへと引き上げました。
MLFlow 形式へのモデルのエクスポート
Dataiku と MLFlow との統合は、特に開発者コミュニティと、使い慣れたテクノロジーを引き続き使いたいと考えている専門家のデータサイエンティストにとって、大きな注目を浴びている点となっています。
MLFlow モデルは、Dataiku 10 以降、saved models として Dataiku にインポートでき、
Dataiku 11 以降 experiment tracking に含めることができます。
この統合の強化の一環として、Dataiku 11.1 では開発されたモデルを MLFlow 形式でエクスポートすることができるようになりました。これは、オープンソースフレームワークをアーキテクチャに組み込んだり、Dataiku 外部にモデルをデプロイしたりする ML エンジニア向けの機能となります。
ビジュアルデザイナー向けの追加のチャートタイプ
Dataiku 11.1 では、ユーザーがデータを視覚化して探索するのに役立つ新しいチャート タイプが導入されています。KPI チャートを使用して、ユーザーはビジネス目標に関連する値を測定および追跡できるようになりました。
チームは、これらのチャートを使用して KPI の進行状況とステータスをすばやく測定するため、条件付きフォーマッティングによって提供される明確な視覚的合図を高く評価します。
Dataiku には、カテゴリおよび階層データ内の要素間の関係と比率を視覚化するためのオプションとして、ツリーマップも含まれるようになりました。
新機能についてさらに詳しく
Dataiku製品の新機能について、詳しくはこちらのコミュニティ記事をご参照ください。
原文: Modelers, ML Engineers, and Analysts: New Reasons for You to Love Dataiku 11