##Azure Synapse Analytics とは?
これについては公式ドキュメントや他の記事を読んでもらった方がよいが下図のようにModern Data Warehouseで複雑になりがちな処理(ETL、集計、MLなど)を一カ所に集約して簡素化したサービスである。Simple is best.
Azure Synapse Analytics についてまとめてみた
Azure Synapse Analytics の全体像は下図のとおりだ。一見複雑に見えるかもしれないが、SQLオンデマンドが追加されたものの基本的にはSQL Data Warehouse、Spark, Data Factoryといった既存サービスの組み合わせだ。Azure Synapse Analytics Workspaceという入れ物で纏めて管理できるようになっていおり各サービスの相互接続性が上がっている。これはSynapseに閉じた話ではなくAzure Synapse Link for Azure Cosmos DBなど外部のサービスとの連携も強化ポイントだ。そのため既存のサービスを理解できていれば難易度は非常に低いであろう。また、Synapose Analytics Studio という管理UIが直感的で使い易いと感じた。ツールの習得難易度の低さもハードルを下げる要因であろう。
###適用範囲
いままで複数のサービスやコンポーネントを組み合わせていた Modern Data Warehouse や ML のシナリオではAzure Synapse Anaylticsで纏めて管理できる分に便利であろう。おそらくLambda architectureでも強みを発揮すると思う。ただしリアルタイム処理についてCosmos DBやAzure Stream Analyticsを活用したドキュメントは見かけたが記事執筆時点でその他のパターンが見つけられていないので調査が必要だ。ベースはただのSparkなのでDelta、Streamingなども使えるのではないだろうか。またDevOpsやCI/CDまわりも気になるところである。例えばAzure Data FactoryにはGit連携の機能があったがSynapseには見当たらない。(もし既に詳しい人がいたらご教授願いたい。)また、IaCについてARMはあったがterraformはまだ未対応(2020/07/10時点)なので今後に期待だ。
###試してみよう
前述したようにSynapose Analytics Studioはとても直感的で使い易い。Data Factory はほぼそのままで、 SQL Server向けのUIも提供されている。もちろん既存のツールであるSQL Server ManagementやVisual Studioなどもそのまま活用できる。
また試してみる分にはハンズオントレーニングやチュートリアルがおすすめである。
Azure-Samples - Synapse
Azure Synapse Analytics エンドツーエンド ソリューション - ハンズオントレーニング
*2020/07/13時点では動かなかったので今後のUpdateに期待