はじめに
Synapse Analytics Workspacesがパブリックプレビューされています!
本記事は自分用のまとめとして、勉強しながらSynapse Analyticsの使い始めをメモしたものです。
Azure Synapse Analyticsの公式日本語ドキュメント
Azure Synapse Analytics (ワークスペース プレビュー)でのワークスペース作成
Azure Data Lake Storage Gen2とは
- Azure Data Lake Storage Gen2 は、ビッグデータ分析専用の機能セットであり、Azure Blob Storage に基づいて構築されています。
- Data Lake Storage Gen2 は、Azure Blob ストレージと Azure Data Lake Storage Gen1 という、既存の 2 つのストレージ サービスの機能を集約したものです。
- Data Lake Storage Gen2 の基礎部分は、BLOB ストレージに階層型名前空間を追加したもの
参考:https://docs.microsoft.com/ja-jp/azure/storage/blobs/data-lake-storage-introduction
要するに、サイズ無制限であらゆる種類のデータを保存できたAzure Data Lake Store Gen1にBlob Storageの機能が加わり、安価に使えるようになったもの、という理解です。
階層型名前空間って..?
-
オブジェクトストレージの場合
- / (スラッシュ)は疑似的にディレクトリを表現
- ディレクトリ名を変更する場合、すべてのファイルを操作する必要があり、ファイル数だけオーバーヘッドが発生する
-
階層型名前空間
- / (スラッシュ)はディレクトリを表現
- ファイル数に依存することなく、最低限の操作でディレクトリ操作が可能
参考:https://eventmarketing.blob.core.windows.net/decode2019-after/decode19_PDF_DP04.pdf
Next Steps
Synapse Studioを使用する
その他参考