こちらで紹介されている新機能、Identity列を試してみました。
Databricks SQLでテーブルを作成して、データをインサートしていきます。
Databricks SQLにアクセス
Databricksワークスペースにログインし、サイドメニューのペルソナスイッチャーでSQLを選択します。
テーブルの作成
-
以下のクエリーを入力します。
USE
で指定するデータベースは適宜変更してください。SQLUSE `20210826_workshop_takaakiyayoidatabrickscom`; CREATE OR REPLACE TABLE demo ( id BIGINT GENERATED ALWAYS AS IDENTITY, product_type STRING, sales BIGINT );
行のインサート
-
ダミーの行をインサートします。
SQLUSE `20210826_workshop_takaakiyayoidatabrickscom`; INSERT INTO demo (product_type, sales) VALUES ("Batteries", 150000); INSERT INTO demo (product_type, sales) VALUES ("Chargers", 200000);
-
テーブルを確認します。
SQLSELECT * FROM `20210826_workshop_takaakiyayoidatabrickscom`.demo ORDER BY id ASC;
-
さらにダミーの行をインサートします。
SQLUSE `20210826_workshop_takaakiyayoidatabrickscom`; INSERT INTO demo (product_type, sales) VALUES ("Papers", 50000); INSERT INTO demo (product_type, sales) VALUES ("Repair", 1200000);
-
テーブルを確認します。
SQLSELECT * FROM `20210826_workshop_takaakiyayoidatabrickscom`.demo ORDER BY id ASC;
クリーンアップするにはテーブルをドロップしてください。
SQL
DROP TABLE `20210826_workshop_takaakiyayoidatabrickscom`.demo
このようにIdentity列を使うことで、データベースでは当たり前の主キー・外部キーによるテーブル結合がデータレイク上のデータでも容易に行えるようになります。