LoginSignup
42
40

Databricksクイックスタートガイド

Last updated at Posted at 2021-04-12

初めてDatabricksを利用される方向けに、マニュアルからピックアップしたコンテンツを翻訳したものになります。全文はDatabricks documentation | Databricks on AWSから参照できます。

こちらの内容は古いものとなっています。以下の日本語ドキュメントをご覧ください。

Databricksドキュメント | Databricks on AWS

また、最新のはじめてのDatabricksをご覧ください。

注意

  • 本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては英語ドキュメントを参照ください。
  • こちらは翻訳時点の内容となります。可能な限りアップデートしていきますが、最新の状態でない箇所がある可能性をご了承ください。
  • AWSでの利用を想定したものとなっています。
  • 誤記、翻訳要望等ございましたら、コメントでご指摘いただけると幸いです。

本出しました!

Databricksのコンセプト

Databricksとは何かを説明します。

Databricks環境のセットアップ(管理者向け)

Databricks環境セットアップ手順をご説明します。

AWSでフリートライアルを実施する際には、Databricksからのサポートを受けることをお勧めします。Databricks担当までお問い合わせください。

セットアップ完了後にこちらをご一読ください。

Unity Catalogのセットアップ(管理者向け)

データ資産に対するガバナンスを強化し、データ管理に関する様々な機能を活用できる様にUnity Catalogを利用することをお勧めします。

ユーザー向けスタートガイド

データサイエンティスト、データエンジニア、データアナリストが利用するDatabricksワークスペースと利用方法をご説明します。

ユーザーとして一通りDatabricksの機能を体験したいという場合には、以下のチュートリアルを実施することをお勧めします。

Databricksクラスター

Databricksでデータ分析やデータ加工を行う際に必ず必要になるクラスターについてご説明します。コストの考え方やベストプラクティスに関してはDatabricksクラスター設定のベストプラクティスをご一読ください。

Databricksノートブック

Databricksの多くの作業を実施することになるノートブックの使い方をご説明します。

Databricksのジョブ

処理を定期実行するためにジョブを作成することができます。

データエンジニアリングに関わる作業

Databricks上で、どのようにデータを読み込み、加工するのかをデータエンジニアリングにおける重要なコンポーネントとなるDelta Lakeを含めてご説明します。

機械学習に関わる作業

MLflowを用いて、どのように機械学習モデルを管理するのかをご説明します。

BIに関わる作業

Databricks SQLを活用することで、データレイク上の大量データに対する高速BIが可能となります。

ツール連携

コード管理、IDE連携などもサポートしています。

Databricksにおけるセキュリティ

様々なセキュリティ要件に応えるための機能も提供しています。

サポート

Databricksのサポートです。

学習コンテンツ

その他のDatabricksに関する記事

他の記事を以下のリンク先にまとめています。

Databricksクイックスタートガイド

Databricksクイックスタートガイド

Databricks 無料トライアル

Databricks 無料トライアル

42
40
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
42
40