LoginSignup
1
1

こちらのマニュアルの翻訳にも記載がありますが、あらためて説明をまとめてみました。

こちらのブログ記事でも詳細を説明しています。

注意
2024/4/10時点の内容です。機能追加やユーザビリティ改善によってGUIが変更されることがあります。

はじめに

Databricksを操作する際、ユーザーの方はワークスペースで作業することになります。

ワークスペースでは、Jupyter notebookと同様の(色々拡張されていますが)ノートブックを用いて、様々なロジックを記述します。これらのノートブックはフォルダに格納することで整理することができます。

また、ノートブックに記述したロジックを実行するには、計算資源であるクラスターが必要となります。要件に応じて様々な設定のクラスターを作成することができます。ノートブックを稼働中のクラスターにアタッチすることで、処理を実行できるようになります。

そして、Databricksで取り扱うデータは、カタログやデータベースで管理することが可能です。

Databricksワークスペースにはこれ以外の機能もありますが、本書では上述の機能にフォーカスして関連する画面を説明します。

ワークスペースのランディングページ

Databricksにログインすると以下のようなページが表示されます。これがランディングページです。
Screenshot 2024-04-10 at 14.04.17.png

言語の変更

デフォルト言語が英語なので、日本語に切り替えます。

  1. 画面右上の自分のメールアドレスをクリックしてメニューを展開します。
  2. User Settingsをクリックします。
    Screenshot 2024-04-10 at 14.04.45.png
  3. 設定画面に移動します。Preferencesをクリックします。
    Screenshot 2024-04-10 at 14.05.17.png
  4. Languageから日本語を選択します。
    Screenshot 2024-04-10 at 14.06.00.png
  5. GUIが日本語になりました。
    Screenshot 2024-04-10 at 14.06.21.png
  6. 画面右上のdatabricksロゴをクリックして、ランディングページに戻ります。
    Screenshot 2023-01-25 at 11.45.47.png

サイドメニュー

あらためての画面紹介です。
Screenshot 2023-01-25 at 11.51.21.png

画面左に縦長に配置されているのがサイドメニューです。こちらから主要な機能にアクセスします。
Screenshot 2024-04-10 at 14.07.25.png

サイドメニュー上にカーソルを移動すると、メニューが展開されます。なおこの挙動はメニューの一番下にあるメニューを展開/メニューを折りたたむで変更することができます。
Screenshot 2024-04-10 at 14.08.11.png

今回触れるメニュー項目は以下の通りとなります。

  • 新規
  • ワークスペース
  • クラスター
  • データ

各メニュー項目を説明する前に、ランディングページの他のコンポーネントを説明します。

検索ボックス

Screenshot 2024-04-10 at 14.09.48.png

アクセス権があるノートブック、フォルダなどを検索することができます。ボックスにタイプしてくと候補が表示されます。
Screenshot 2024-04-10 at 14.10.59.png

Enterを押すことで詳細画面が開きます。検索結果のリンクをクリックすることで当該ノートブックなどを開くことができます。
Screenshot 2024-04-10 at 14.11.21.png

ユーザー設定

画面右上の自分のメールアドレスをクリックするとメニューが展開し、ユーザー設定にアクセスすることができます。
Screenshot 2024-04-10 at 14.11.50.png

ヘルプ

ユーザー名の左のクエスチョンマークをクリックすると、アシスタント、ヘルプセンター、ドキュメントなどにアクセスすることができます。
Screenshot 2024-04-10 at 14.12.13.png

サンプル・チュートリアル

画面上部にあるリンクは、Databricksを使い始めた際に利用することが多い機能のサンプルなどを説明しています。
Screenshot 2024-04-10 at 14.09.48.png

最近のアイテム

最近アクセスしたノートブックなどにクイックにアクセスすることができます。
Screenshot 2024-04-10 at 14.12.47.png

お気に入り

お気に入りに登録したアイテムにアクセスできます。
Screenshot 2024-04-10 at 14.13.31.png

人気の

ワークスペースで頻繁にアクセスされているアイテムを参照できます。
Screenshot 2024-04-10 at 14.14.14.png

ワークスペースの詳細はこちらをご覧ください。

新規ボタン

サイドメニューの新規をクリックすると、様々なDatabricks資産をクイックに作成することができます。ボタンをクリックするとメニューが展開されるので、作成したい資産を選択します。それぞれの資産の作成ダイアログが表示されるか、作成画面に移動します。
Screenshot 2024-04-10 at 14.15.05.png

ワークスペース

皆様が開発されるノートブックなどをフォルダに整理することができます。フォルダ階層にアクセスする際にはワークスペースをクリックします。
Screenshot 2024-04-10 at 14.15.26.png

(あなたを含む)各ユーザーのフォルダはUsers配下に作成されます。Usersフォルダをクリックすると、ワークスペースの全ユーザーのホームフォルダが表示されます。なお、アクセス権がない場合は表示されません。あなたのホームフォルダは常に一番上に表示されます。
Screenshot 2024-04-10 at 14.16.05.png

自分のユーザー名(メールアドレス)をクリックすると、あなたのホームフォルダが表示されます。なお、自分のホームフォルダにはツリーの最上位にあるホームでショートカットすることができます。
Screenshot 2024-04-10 at 14.17.30.png

フォルダ内のノートブックをクリックすることで、ノートブックをオープンすることができます。
Screenshot 2024-04-10 at 14.17.51.png

また、フォルダやノートブックの右側には常にScreenshot 2024-04-10 at 14.18.07.pngが表示されています。これはコンテキストメニューを開くためのアイコンです。こちらをクリックするとフォルダやノートブックを操作するためのメニューが表示されます。右クリックでこの操作をショートカットすることができます。
Screenshot 2024-04-10 at 14.18.37.png

クラスター

上述したように、Databricksで処理を実行するにはクラスターが必要です。サイドメニューのクラスターをクリックすると、アクセスできるクラスターの一覧が表示されます。
Screenshot 2024-04-10 at 14.19.54.png

  1. コンピューティングを作成をクリックします。
  2. クラスター設定画面が表示されます。
    Screenshot 2024-04-10 at 14.20.16.png
  3. 必要に応じて設定を変更し、画面下のクラスターを作成をクリックします。
    Screenshot 2024-04-10 at 14.20.37.png
  4. クラスターが起動するまで待ちます。通常数分かかります。クラスター名の右にあるインジケーターがグリーンになるとクラスターが起動したことを意味します。
    Screenshot 2024-04-10 at 14.21.55.png
  5. これでクラスターが起動しました。
    Screenshot 2024-04-10 at 14.26.08.png

あと、少しクラスター設定画面の説明もします。

ライブラリ

  • ライブラリをクリックすると、この画面からクラスターにライブラリをインストールすることができます。
    Screenshot 2024-04-10 at 14.26.39.png
    Screenshot 2024-04-10 at 14.27.23.png
  • PyPI/CRAN/Mavenなどからライブラリをインストールすることができます。
    Screenshot 2024-04-10 at 14.28.06.png
  • インストール済みの状態になると、クラスターにアタッチされているノートブックからimportできるようになります。

イベントログ

クラスターの起動、停止、サイズ変更などのイベントを確認することができます。
Screenshot 2024-04-10 at 14.28.44.png

クラスターの停止

クラスターが起動している時間でDatabricksの課金が発生します。クラスターを使わなくなったら、終了でクラスターを停止します。
Screenshot 2024-04-10 at 14.29.06.png

クラスター名の隣に灰色の●が表示されたらクラスターが停止したことを意味します。
Screenshot 2024-04-10 at 14.30.01.png

クラスターの詳細はこちらをご覧ください。

ノートブック

ノートブックを作成するか、既存のノートブックを開くと、画面全体にノートブックが表示されます。ノートブックを表示した際には、ノートブック専用のメニューが表示されます。
Screenshot 2024-04-10 at 14.31.12.png

ノートブックの詳細に関してはこちらをご覧ください。

タイトル・言語の変更

タイトルをクリックすると名称を変更、Pythonなどの言語名をクリックするとノートブックのデフォルト言語を切り替えることができます。
Screenshot 2024-04-10 at 14.31.12.png
Screenshot 2024-04-10 at 14.32.05.png

ノートブックメニュー

  • タイトルの下にはノートブックを操作するメニューが表示されます。
    Screenshot 2024-04-10 at 14.32.18.png
  • すべてを実行をクリックすると、ノートブックのすべてのコマンドが実行されます。
    Screenshot 2024-04-10 at 14.33.02.png
  • 接続と表示されているボタンをクリックすると、ノートブックをアタッチするクラスターを選択することができます。
    Screenshot 2024-04-10 at 14.34.00.png
  • クラスターを選択するとボタン名称がクラスター名に変化します。これでノートブックを実行できるようになります。
    Screenshot 2024-04-10 at 14.34.54.png
  • ノートブック左のボタンをクリックすると、目次、ワークスペース、カタログ、アシスタントが展開されます。
    Screenshot 2024-04-10 at 14.36.16.png
    Screenshot 2024-04-10 at 14.36.37.png
    Screenshot 2024-04-10 at 14.36.55.png
    Screenshot 2024-04-10 at 14.37.03.png
  • ノートブック右のボタンをクリックすると、上からコメント、エクスペリメント、改訂履歴、変数、ライブラリが表示されます。
    Screenshot 2024-04-10 at 14.37.46.png
    Screenshot 2024-04-10 at 14.38.04.png
    Screenshot 2024-04-10 at 14.38.21.png
    Screenshot 2024-04-10 at 14.38.34.png
    Screenshot 2024-04-10 at 14.39.14.png

ノートブックの操作

ノートブックはセルから構成され、セルにロジックやマークダウンを記述します。

ここでは、pandasでデータを読み込んで可視化してみます。

  1. 最初のセルに以下の内容を記述します。

    import pandas as pd
    
    white_wine = pd.read_csv("/dbfs/databricks-datasets/wine-quality/winequality-white.csv", sep=";")
    
  2. セルを追加するには、セルの上下端にカーソルを移動し、+コード / +テキスト ボタンを表示させます。これをクリックすることでセルを挿入することができます。
    Screenshot 2024-04-10 at 15.06.03.png

  3. 追加したセルに以下の内容を記述します。

    Python
    # 中身を確認します
    display(white_wine)
    
  4. 個々のセルを実行するには、セルの左端に表示されている▶️ボタンを使用します。なお、Shift + Enterでショートカットすることができます。
    Screenshot 2024-04-10 at 15.08.01.png
    Screenshot 2024-04-10 at 15.09.24.png

カタログ

サイドメニューのカタログを選択すると、カタログエクスプローラが表示されます。
Screenshot 2024-04-10 at 15.10.02.png

テーブル名をクリックすることで、テーブルのスキーマやサンプルデータを確認することができます。
Screenshot 2024-04-10 at 15.10.45.png

カタログエクスプローラの詳細はこちらをご覧ください。

基本的な画面のご案内は以上となります。

Databricks 無料トライアル

Databricks 無料トライアル

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1