LoginSignup
7
0

こちらにあるように、新機能が公開されたので早速試してみます。

注意
本書執筆時点では、日本リージョンではまだDatabricksアシスタントを利用できません。もうしばらくお待ちください。

Databricksアシスタントを有効化すると、ノートブックの左側のメニューに学帽マークが表示されます。
Screenshot 2023-07-21 at 21.29.43.png

はじめてのDatabricksアシスタント

上のようにコードを入力しセルを選択した状態で、以下のようなプロンプトを入力します。

generate pandas code to convert the pyspark dataframe to a pandas dataframe and select the 10 most expensive trips from df based on the fare_amount column

これを日本語に訳すと、

pysparkデータフレームをpandasデータフレームに変換し、fare_amountカラムに基づいてdfから最も高価な移動のトップ10を選択するpandasコードを生成してください

ということです。アシスタントに入力します。
Screenshot 2023-07-21 at 21.30.02.png

すると、コードを提示してくれます。長生きするものです。
Screenshot 2023-07-21 at 21.30.46.png

これを新しいセルに挿入して実行します。
Screenshot 2023-07-21 at 21.31.04.png

結果を確認すると、ちゃんと動いています。
Screenshot 2023-07-21 at 21.32.38.png

以下のようにファイルを参照する例でも。

Screenshot 2023-07-21 at 21.33.12.png

コード

display(dbutils.fs.ls("dbfs:/databricks-datasets/bikeSharing/data-001/"))

プロンプト: bikeSharingデータセットのday.csvを読み込むコードを生成してください。

Generate code to read the day.csv file in the bikeSharing dataset

これもちゃんと動く訳です。何だこれ。
Screenshot 2023-07-21 at 21.33.50.png

日本語は?

じゃあ、日本語はどうだという話です。

pysparkデータフレームをpandasデータフレームに変換し、fare_amountカラムに基づいてdfから最も高価な移動のトップ10を選択するpandasコードを生成してください

Screenshot 2023-07-21 at 21.52.47.png

これも動いてしまう。背後ではOpenAIが動いているので言語の壁も何のそのです。
Screenshot 2023-07-21 at 21.54.41.png

本当にコーディングが捗るなーというのが正直な感想です。自然言語とプログラミング言語でロジックを織りなすような感覚。もっと色々活用してみます。

Databricksクイックスタートガイド

Databricksクイックスタートガイド

Databricks無料トライアル

Databricks無料トライアル

7
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
0