search
LoginSignup
19
Help us understand the problem. What are the problem?
Organization

Databricksクイックスタートガイド

初めてDatabricksを利用される方向けに、マニュアルからピックアップしたコンテンツを翻訳したものになります。全文はDatabricks documentation | Databricks on AWSから参照できます。

注意

  • 本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては英語ドキュメントを参照ください。
  • こちらは翻訳時点の内容となります。可能な限りアップデートしていきますが、最新の状態でない箇所がある可能性をご了承ください。
  • AWSでの利用を想定したものとなっています。
  • 誤記、翻訳要望等ございましたら、コメントでご指摘いただけると幸いです。

本出しました!

Databricksのコンセプト

Databricksとは何かを説明します。

Databricks環境のセットアップ(管理者向け)

Databricks環境セットアップ手順をご説明します。

AWSでフリートライアルを実施する際には、Databricksからのサポートを受けることをお勧めします。Databricks担当までお問い合わせください。

セットアップ完了後にこちらをご一読ください。

Unity Catalogのセットアップ(管理者向け)

データ資産に対するガバナンスを強化し、データ管理に関する様々な機能を活用できる様にUnity Catalogを利用することをお勧めします。

ユーザー向けスタートガイド

データサイエンティスト、データエンジニア、データアナリストが利用するDatabricksワークスペースと利用方法をご説明します。

ユーザーとして一通りDatabricksの機能を体験したいという場合には、以下のチュートリアルを実施することをお勧めします。

Databricksクラスター

Databricksでデータ分析やデータ加工を行う際に必ず必要になるクラスターについてご説明します。コストの考え方やベストプラクティスに関してはDatabricksクラスター設定のベストプラクティスをご一読ください。

Databricksノートブック

Databricksの多くの作業を実施することになるノートブックの使い方をご説明します。

Databricksのジョブ

処理を定期実行するためにジョブを作成することができます。

データエンジニアリングに関わる作業

Databricks上で、どのようにデータを読み込み、加工するのかをデータエンジニアリングにおける重要なコンポーネントとなるDelta Lakeを含めてご説明します。

機械学習に関わる作業

MLflowを用いて、どのように機械学習モデルを管理するのかをご説明します。

BIに関わる作業

Databricks SQLを活用することで、データレイク上の大量データに対する高速BIが可能となります。

ツール連携

コード管理、IDE連携などもサポートしています。

Databricksにおけるセキュリティ

様々なセキュリティ要件に応えるための機能も提供しています。

サポート

Databricksのサポートです。

学習コンテンツ

その他のDatabricksに関する記事

他の記事を以下のリンク先にまとめています。

Databricks 無料トライアル

Databricks 無料トライアル

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
19
Help us understand the problem. What are the problem?