No-code data science and machine learning - Databricksの翻訳です。
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
組織全体におけるデータサイエンスを拡大し、すべての人がデータドリブンの意思決定を支援します。
エンタープライズの信頼性を持つツールでシチズンデータサイエンティスト向けにスケール
Databricksは、みなさまが数クリックで膨大な複雑なデータセットの分析、洞察の発見、予測を行えるように支援をします。一行のコードを記述することなしに、データを整理、変換、可視化します。
非エンジニア向けのデータエンジニア
機械学習はデータエンジニアリングからスタートします。最初に、コードを記述することなしに、データを準備、変換、可視化し、探索的データ分析を実施します。Databricksを用いることで、組織の誰でも後段のユースケースで使用するデータを準備することができます。
完全に自動化された機械学習
No-code data science and machine learning - Databricks
Databricks AutoMLはシチズンデータサイエンティストに対してガラスボックスアプローチを提供し、データの前処理、特徴量エンジニアリング、モデルトレーニング、チューニングのヘビーリフティングを自動化することで、チームはクイックに機械学習モデルを構築、トレーニング、デプロイすることができます。
必要に応じて詳細を確認できるための透明性と可視性
Databricksにおける機械学習に固有のものですが、UIで実行されたすべてのステップは、内部でプロダクションレベルのコードとして生成されます。
エキスパートのデータサイエンティスト、機械学習エンジニアはコードを調査し、自身のカスタマイゼーションを追加することができ、規制に対応する部署は再現性や透明性が重要になるケースで、これらを参照することができます。Databricks Machine LearningはネイティブでMLflowとインテグレーションされており、前処理から特徴量エンジニアリング、トレーニング、デプロイメントに至るまで、きめ細かいエクスペリメント追跡やバージョン管理を実現します。
機能横断でのコラボレーションのための説明可能性とコンプライアンス
完全なリネージトラッキングや自動生成コードの登録に関するDatabricksのサポートは、皆様のデータサイエンスプロジェクトがセキュアで、法令に準拠しており、追跡可能であることを保証します。特徴量の説明可能性は、生成されたモデルにおいてどの入力が最も重要であるのかに関する洞察を提供します。これによって、ユーザー、データサイエンティスト、機械学習エンジニア、IT、リーガル、コンプライアンス部門などさまざまなチームがコラボレーションする基盤を構築することができます。