多くの企業では、分析やAI開発プロセスを拡大できていません。その背景には、手作業が多い、業務部門から切り離されている、透明性や必要なコントロールが不十分であるといった事情があります。そんな中、アナリティクスのリーダーは、AIと機械学習(ML)を大規模に拡大するには、技術専門家を雇用するだけでは達成できないことを理解しています。一方で、企業はより多くのプロジェクトを立ち上げ、既存の人材とリソースを活用し、多くの価値を実現する必要があります。AIから価値を生み出すためには、企業はデータサイエンスをより効率的かつ効果的に活用できるものにすることで、会社中のテクノロジーに精通した人々が予測分析を構築できるようにし、また、それらの分析プロジェクトを堅牢で透明性のあるものとさせ、本番稼働でも十分に使えるようなものにする必要があります。
技術者向けの機能の充足
データサイエンティスト、データエンジニア、MLエンジニアは、今日最も価値があり、必要とされているいる仕事の一つです。しかしながら、有能なデータサイエンティストは、環境のセットアップや保守、データの準備、そしてプロジェクトの本番環境への移行を支援することにほとんどの時間を費やしているのです。Dataikuはすでに共同作業が可能なプロジェクト環境を提供しているため、データアナリストがデータ準備を担当したり、IT部門がMLOpsを担当したりすることができます。
Dataiku 11では、高度な技術者の皆さまに活用いただける機能を充足させました。データ専門家の皆さまがDataiku V11で実現できることが増え、AIプロジェクトからより多くの価値を提供できるようになります。Dataikuの新しいCode Studioは、JupyterLab、VSCode、RStudio、webappフレームワーク(StreamLitを含む)などの人気のあるIDEをDataikuに直接組み込んでいるため、データ専門家は馴染みのあるツールで作業したものを、セットアップや管理をすることなく、Dataiku上のプロジェクトに反映できます。Experiment Trackingは、MLFlowに組み込まれているものを含め、ノートブックまたはIDEで作成されたすべてのモデル実行結果を保存し比較できる、中心的なインターフェースを提供します。Feature Storeを使用することで、実験や本番環境での再利用に適しているキュレーションされた特徴量などの参照用データセットに簡単にアクセスして共有することできます。Visual Deep Learningは、オブジェクト検出と画像分類のすぐに使用できるユースケースを提供します。 Managed Labelingは、プロジェクトマネージャーがアノテーションの専門家チームと共に画像ラベリングプロジェクトを立ち上げ管理できるようにすることで、画像認識のユースケースの加速を支援します。
→Dataiku V11のCode Studio機能について、詳細はこちら(英語)
業務の専門家によるAI活用を促進する
AIの使用を拡げるには、データ専門家のための機能だけでは不十分です。業務とデータの両方に精通した人々が次のステップに進みそれぞれの分野でAIやMLプロジェクトを立ち上げることで、組織におけるAIの可能性を最大限に引き出すことができます。顧客をセグメント化して解約を防ぐ方法を考えるマーケティングの技術者や、デスクトップツールを使って予測を立てている財務チームについて、想像してみてください。彼らは専門的なスキルを持っており、適切なツールを使うことで、新しい問題への取り組みを素早く開始することができます。
→Dataiku V11のビジュアル時系列分析機能について、詳細はこちら(英語)
Dataiku 11は、これまでと同様に、各業務領域の専門家(SME: Subject Matter Experts)、シチズンデータサイエンティスト、ナレッジワーカーの皆さまに、高度にビジュアル化されたGUIのノーコードツールを提供し、ビジネスへの貢献をサポートします。Visual Time Series Forecastingにより、データプロフェッショナルは、コーディングなしで予測モデルを設計、トレーニング、評価、および展開できます。各コンポーネントの所有者は、それらをチームメートが再利用できるようにQuick Sharingの機能で簡単に共有できます。Outcome Optimizationはwhat-if分析を強化する機能で、回帰モデルにより予測される結果を最大化、最小化、あるいは狙いの値にするような入力値の最適なセットをインテリジェントに見つけることができます。準備レシピの新しいcreate if、then、elseステートメントプロセッサーにより、複雑だったりネストされたステートメントを作成することができるため、透明性を高めながらもデータ準備の時間を節約できます。
AI活用に対する経営者の信頼とコントロールを高める
AI活用を拡げるための秘訣は、組織に対する信頼とリスクを管理することです。組織には、本番環境で失敗したり、顧客に偏った結果をもたらすプロジェクトを展開するような余裕はありません。Dataiku 11は新しい機能を投入することで、責任あるAIの実現とAIガバナンスの追求を続けています。Flow Document Generatorにより、プロジェクトフローの内容に関するすべての情報を一覧表示するような、詳細なスナップショットレポートをすばやく簡単に作成することができます。モデルドキュメントジェネレータと共に利用することで、企業は、プロジェクトとモデルの現在の状態について、必要なことをすべてドキュメント化することができます。
プロジェクトを本番環境に移行する前には、トレーニングでは見られなかった条件にモデルをさらすことが不可欠です。Model Stress Testでは、潜在的なデータ品質の問題をシミュレートするような一連のストレステストをモデルに適用し、悪条件下での動作とパフォーマンスをチェックします。Dataiku 10のモデルガバナンスと同様に、ガバナンス機能では、分析パイプラインやバンドルレジストリ、承認ワークフローを備えたプロジェクトアーティファクトなど、Dataikuプロジェクトバンドルの包括的なガバナンスが可能です。
→Dataiku V11のFlow Document Generatorについて、詳細はこちら(英語)
7月に提供開始となるDataiku 11は、組織がEveryday AIを実現するために非常に重要なリリースです。このリリースは、データ専門家チームがより多くの価値を大規模に実現できるようにするための新機能、技術に精通したナレッジワーカーの方々が新しいチャレンジに取り組むための機能を提供すると共に、経営者が求めるプロジェクトの堅牢性、透明性、および本番への準備を確実なものとするためのAIガバナンスを提供します。
Dataiku V11について詳細はこちら
V11のな機能と、さまざまな役割の方々への幅広いメリットについて説明しています。
原文:Dataiku 11: Connect Your Experts With the Platform for Everyday AI