はじめに
Fabric Data Factory では、データ統合の学習用のサンプルデータが利用できます。
このデータがどのように公開されているか、アクセス方法とともに紹介します。
この記事は私があるハンズオンのワークアラウンドを模索するために見つけた、裏道的な小技の紹介であり、何らかのワークアラウンドにのみ使用するようにしてください。
データの置き場所
たとえば、以下のサンプルデータの Retail Data ~ は、
https://fabrictutorialdata.blob.core.windows.net/sampledata で公開されていることが、コピーアクティビティのソースにサンプルデータを選択した際の JSON 構造から確認できます。
他のサンプルデータ
- Public Holidays -> https://azureopendatastorage.blob.core.windows.net/holidaydatacontainer
- NYC Taxi Green -> https://azureopendatastorage.blob.core.windows.net/nyctlc
アクセスの方法
Blob ストレージとしてこれらのコンテナ URL にアクセスすると、中身の確認が可能です。
コピージョブで試してみます。
コピージョブを作成し、データソースの選択で Azure Blob を選択します。
対象のコンテナまでの URL を入力し、匿名認証で進めます。
初回はエラーになります。コンテナをリストしようとしてしまうためですが、コンテナを指定してやります。
このように特定のコンテナでしかアクセスができない状態では、コンテナやフォルダーを指定することで最小の権限でアクセスすることができるケースがあります。
コンテナ内の BLOB が表示されます。サンプルデータのコンテナ内ではリストなどの匿名アクセスが許可されているようです。
さまざまなサンプルデータが公開されていることがわかりますが、通常のルートでサンプルとして表示される Wide World Importers のデータセットのパスはこちらになっています。
なお、バイナリコピーでコピーすることで、ファイルを読み取らずにそのまま取得可能です。
任意のレイクハウスなどにデータをコピーすることができました。
以上、もしかしたらワークアラウンドに使えるニッチな小技の紹介でした。








