2024/10/18に発行されたSoftware Design 2024年10月号に、連載Databricksで勝つデータ活用の第7回としてDatabricksとデータウェアハウスを寄稿しました。
雑誌に寄稿するのは生まれて初めてのことだったので、嬉しさのあまりポエム記事を書いてみます。
著者について
Databricksに入社して約4年になる50代のエンジニア。過去にデータブリックス クイックスタートガイドを出版したり、Apache Spark徹底入門の翻訳に携わりましたが、雑誌に寄稿させていただくのは初めての体験です。長生きしてみるものです。
きっかけ
同僚のエンジニアの方のお声がけで、すでに連載Databricksで勝つデータ活用がスタートしていましたが、当初は私は関与していませんでした。しかし、予定していた第6回まで進んだところ延長の打診があったとのことで、手を上げさせていただきました。
第6回まではデータエンジニアリングや機械学習、LLMなどのトピックをカバーしていたので、まだカバーしていなかったデータウェアハウスのトピックを書かせていただくことになりました。私の回はDatabricksにおけるデータウェアハウス、特にバックエンドにフォーカスしたものとし、次回の第7回ではダッシュボードなどフロントエンドにフォーカスした内容とすることになりました。
内容
以下の内容をカバーしています:
- Databricksとデータウェアハウスの関係は?(Databrickdでもデータウェアハウスのワークロードは普通に実行できます!)
- Databricksでデータウェアハウスの機能を担うDatabricks SQL
- Databricks SQLが提供する様々なデータウェアハウス機能(主キー、地理空間情報、AI関数などなど)
書店に並んでいますので、是非お手に取ってみてください!102ページからです!