Join Us for Updates to Databricks Notebooks at Data and AI Summit 2022 - The Databricks Blogの翻訳です。
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
Databricksにおいては、データから洞察に至る道のりを加速するために、開発体験を継続的に進化させ続けています。本日、6/27-30に開催されるData + AIサミット(登録はこちらから!)に先立ちDatabricksノートブックの更なる改善を発表できることを嬉しく思っています。SQLとPython間のディープな連携、簡素化された計算処理、Jupyterエコシステムの取り込み、新たなローコードのデータ探索ツール、監査ログによるトラッキングへの容易なアクセスなど、どのように我々が開発体験を改善しているのかを見るために是非サミットに参加してください。
ノートブックにインテグレーションされた計算資源管理
皆様が適切なリソースを検索するのに要する時間を削減し作業自体に時間を費やせるように設計することで、我々は計算資源を選択するノートブックのUIを徹底的に再構築しました。最近使った計算資源をすぐに利用することができ、新たなリソースを必要とした場合には、ノートブックの画面を去ることなしに数クリックでクラスターを作成することができます。
お手軽に計算資源を作成できることで、自身のタスクにフォーカスできます
PythonからSQLの結果に容易にアクセス
PythonとSQLはDatabricksノートブックにおいて最も人気のある2つの言語となっており、多くの場合ユーザーはPythonで詳細分析を行う前にSQLでデータをロードします。今では、Pythonノートブック上のSQLセルの結果を探索するのにPythonを使うことができます。手動で二つの言語間で変換を行うことなしに、PythonデータフレームとしてSQLセルの結果を取得することができます。
SQLの結果をは自動でPythonデータフレームに変換され、追加のコードを書く必要がなくなります
PythonノートブックへのIpywidgetの導入
IPythonカーネル上でのipywidgetのサポート(現在パブリックプレビュー)によって、ノートブック上で30以上の様々なUIエレメントと豊富なコントロールとインタラクションできるようになります。これによって、DatabricksノートブックにJupyterエコシステムのパワーをもたらすことができます。
以下のリンクをクリックすると動画が別タブで開きます
お使いのノートブックに30以上のフレキシブルなウィジェットによる偉大なビジュアルとインタラクティブ性を追加
BamboolibによるUIベースのデータ探索
シンプルかつユーザーフレンドリーなインタフェースを用いて、データの準備、変換、可視化、探索を行えるようになります!ノートブックにインテグレーションされる拡張可能なGUIであるBamboolibを用いることで、ノーコードのデータ探索で時間を節約しつつも、結果を再現、カスタマイズするために生成されたコードにアクセスすることもできます。これによって、シチズンデータサイエンティストの方やドメイン専門家がPythonを用いて簡単にデータを操作できるようになります。
以下のリンクをクリックすると動画が別タブで開きます
ユーザーフレンドリーですがパワフルなUIを用いてローコードのデータ探索を楽しんでください
ノートブックセルの実行に対する監査ログによるコンプライアンスの改善
すべてのノートブックへのアクセスやユーザーによる改訂はユーザーのIDを関連づけられるので、セキュリティ管理者は容易に自分のワークスペースで行われたアクションを監査できるようになります。Databricksノートブック内の個々のセルの実行をロギングすることで透明性の確保をさらに推し進めました。これによって、管理者は誰が何を、いつ、どこで行ったのかを常に知ることができ、アクセス管理とID管理を改善します。
Databricksノートブックのセル実行レベルまで追跡することで監査能力を改善します
より詳細は
- Data + AIサミット2022に登録ください: https://databricks.com/jp/dataaisummit/
- ノートブックに対する一般的な情報: https://docs.databricks.com/notebooks/index.html
- ノートブックのベストプラクティス: https://docs.databricks.com/notebooks/best-practices.html