Export and import Databricks notebooks | Databricks on AWS [2022/11/30時点]の翻訳です。
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
Databricksでは、以下のフォーマットでノートブックをインポート、エクスポートすることができます。
- ソースファイル: 拡張子
.scala
、.py
、.sql
、.r
であるソースコードのみを含むファイル。 - HTML: 拡張子
.html
のDatabricksノートブック。 - Databricks
.dbc
アーカイブ - IPythonノートブック: 拡張子
.ipynb
のJupyter notebook。 - RMarkdown: 拡張子
.Rmd
のR Markdown document。
ノートブックのインポート
URLあるいはファイルから外部ノートブックをインポートすることができます。また、DatabricksワークスペースからバルクでエクスポートされたノートブックのZIPアーカイブをインポートすることもできます。
- サイドバーのWorkspaceをクリックします。以下のいずれかを実行します。
- URLあるいはサポートされている外部フォーマット、DatabricksワークスペースからエクスポートされたZIPアーカイブを含むファイルを選択します。
-
Importをクリックします。
- 一つのノートブックを選択した場合には、現在のフォルダにインポートされます。
- DBCやZIPアーカイブを選択した場合、現在のフォルダにフォルダ構成が再作成され、それぞれのノートブックがインポートされます。
ファイルをインポートしてノートブックに変換
ファイルの最初のセルにコメントを追加することでPython、SQL、Scala、Rスクリプトを単一セルのノートブックに変換することができます。
# Databricks notebook source
-- Databricks notebook source
// Databricks notebook source
# Databricks notebook source
スクリプトでセルを定義するには、以下に示す特殊なコメントを使用します。Databricksにスクリプトをインポートすると、COMMAND
のラインでマークされた内容でセルが生成されます。
# COMMAND ----------
-- COMMAND ----------
// COMMAND ----------
# COMMAND ----------
ノートブックのエクスポート
ノートブックツールバーでFile > Exportを選択し、エクスポートのフォーマットを選択します。
注意
HTML、IPythonノートブック(.ipynb)、アーカイブ(DBC)としてノートブックをエクスポートし、コマンド出力をクリアしていない場合、エクスポートに出力が含まれます。
フォルダの全てのノートブックをエクスポート
注意
HTML、IPythonノートブック(.ipynb)、アーカイブ(DBC)としてノートブックをエクスポートし、コマンド出力をクリアしていない場合、エクスポートに出力が含まれます。
ワークスペースフォルダの全てのフォルダをZIPアーカイブでエクスポートするには:
- サイドバーのWorkspaceをクリックします。以下のいずれかを実行します。
- エクスポートのフォーマットを選択します:
- DBCアーカイブ: メタデータとノートブックコマンドの出力を含むバイナリーフォーマットであるDatabricksアーカイブをエクスポートします。
- ソースファイル: Databricksワークスペースにインポートでき、CI/CDパイプラインで使用でき、それぞれのノートブックのデフォルト言語でソースファイルを参照できるノートブックソースファイルのZIPアーカイブをエクスポートします。ノートブックのコマンドアウトプットは含まれません。
- HTMLアーカイブ: HTMLファイルのZIPアーカイブをエクスポートします。それぞれのノートブックHTMLファイルはDatabricksワークスペースにインポートすることができ、HTMLとして参照することができます。ノートブックのコマンドアウトプットは含まれます。