11
9

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Azure Data Factory と Azure Synapse Analytics (Synapse Pipeline) の相違点の調査

Last updated at Posted at 2022-07-04

はじめに

Azure Data Factory と Azure Synapse Analytics Synapse Pipeline の相違点を聞かれたため、本記事で整理します。

注意事項

本記事は2022年7月4日時点における情報をもとに記載しておりますので、ドキュメント等により最新情報を確認するようにしてください。

特に現時点で利用できない機能については、更新により相違点がなくなることが予想されます。

主に確認すべきドキュメント

個別機能のドキュメントにて、Azure Data Factory と Azure Synapse Analytics Synapse Pipeline における機能利用可否(適用対象)が記載されています。次の画像では、Azure Data Factory で利用できるが、 Azure Synapse Analytics Synapse Pipeline では利用できないことを表しています。

image.png
引用元:PowerShell で共有のセルフホステッド統合ランタイムを作成する - Azure Data Factory | Microsoft Docs

Azure Data Factory と Azure Synapse Analytics Synapse Pipeline の利用指針

大規模なデータ統合ワークフロー(オーケストレーション)を構築する場合

大規模なデータ統合ワークフローを構築する場合には、次の理由により、 複数のAzure Data Factory の利用をすることがおすすめです。

1. パイプラインの制限の観点

  • パイプライン数の上限が、Azure Synapse Analytics Synapse Pipeline でのが 800 であること
  • Integration Runtime の共有が、Azure Data Factory でのみ利用できること

Azure Synapse Analytics Synapse Pipeline でのが 800 であることは、次のように記載されています。Azure Data Factory の上限数の記載は確認できませんでした。

image.png
引用元:Synapse パイプラインの制限

Integration Runtime の共有への対応状況については、次のように記載されています。

image.png
引用元:ADF および Azure Synapse Analytics で利用可能な機能

2. アクセス制御の観点

DataFactory内ではリンクサービスに対して一部の開発者のみにアクセス権を与えるような権限制御はできません。
したがって、大人数での同Azure Data Factoryには向かず、同じアクセス権をもつ開発者グループに一つAzure Data Factory を割り当てるような運用が好ましいです。

一方で、Synapse Workspace内では一部のオブジェクトに対するアクセス制御を実装できるため、分析チーム内でのロールに応じて権限の管理をできます。

image.png

引用元:ワークスペース項目スコープのロールの割り当てを追加する

3. リソース数の制限の観点(サブスクリプション内の制限で考える)

Synapse Workspace は分析に重点をおいたワークスペース環境であるため、既定の制限は控えめです。
また、Synapse はデータ接続用のsqlエンドポイントをもつことになるので、守るべき場所が増えるという見方もあります。

image.png

引用元:Synapse ワークスペースの制限

※Azure Data Factoryについては確認できず。

補足とまとめ

大規模ワークフローにおけるAzure Data Factory の分割単位についてはデータソースシステムか、それを事業領域でまとめた単位がよいでしょう。

Synapse Analyticsnの構成単位についても、データ統合後の分析プロジェクト単位(データ統合用途ではなく、キュレーションするための場所として考える)で利用するのがよりスケールしやすい仕組みとなるかと思います。

一方で、複数の事業領域やチームにまたがらない小中規模のデータプロジェクトであれば単一のSynapse Analyticsで統合からDWH化までカバーできるといえるでしょう。
この時、データ統合のためのチームと分析環境のためのチームが分かれるのであればAzure Data Factory と Synapse Analyticsをそれぞれ一つずつ併用するようなパターンも考えられます。

これらはデータ製品としてなにが土台になるかから決まります。

データ製品の考え方については以下の参考資料をご参照ください。

What's Data Lake ? Azure Data Lake best practice

11
9
3

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
11
9

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?