概要
Databricks にて Python ファイルや CSV ファイルなどをまとめてエクスポートしたいときにはSource file
としてエクスポートすることがおすすめです。
Databricks Workspace 上のコンテンツをエクスポートする際には、dbc ファイルとしてエクスポートすることが一般的だったのですが、Source file
としてエクスポートできるようになりました。
Python ファイルや CSV ファイルを保持しているフォルダを、DBC archieve
ではノートブックのみエクスポートされます。
同様のフォルダをSource file
にてエクスポートすると、すべてのエクスポートされることを確認できました
事前準備
1. Databricks workspace 上にフォルダを作成後、ノートブックや Python ファイルなどを作成
エクスポートした際の動作確認
1. DBC archieve
としてエクスポートした場合の動作
1-1. 作成したフォルダのハンバーガーメニュー(…
) -> Export
-> DBC archieve
を選択
1-2. ダウンロードしたファイルの拡張子をdbc
からzip
に変更
1-3. zip ファイルを解凍後にフォルダを確認すると ノートブックのコードのみが保持されていることを確認
2. Source file
としてエクスポートした場合の動作
2-1. 作成したフォルダのハンバーガーメニュー(…
) -> Export
-> Source file
を選択
2-2. zip ファイルを解凍後にフォルダを確認すると Python ファイルや CSV ファイルが保持されていることを確認
まとめ
Databricks にて Python ファイルや CSV ファイルなどをまとめてエクスポートしたいときにはSource file
としてエクスポートすることで可能であることを検証しました。エクスポートしたファイルをインポートすることもできます。