0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Azure Data Factory でWeb上のテーブルを取得する

Posted at

はじめに

Azure Data Factory(以下、ADF)では多様なデータソースをサポートしています。
今回はWeb上のテーブルからデータを取得する方法についてまとめます。

※webページへの負担をかけすぎないようにご注意くださいませ。

前提

  • Self-Hosted IRをインストールしたマシンが必要です。
  • 一部、取得先の確認用にExcel or Power BIを利用します。

手順

参考リンク

取得先は下記の国税庁のサイト内の企業規模別の平均給与リンクにします。
http://www.nta.go.jp/publication/statistics/kokuzeicho/minkan1997/menu/04.htm

手順の流れは下記です。

  • 取得先へのリンクドサービスの作成
  • インデックスの確認
  • データセットの作成

取得先へのリンクドサービスの作成

newからリンクドサービスを作成します。

image.png

webを選択し、
image.png

Self-Hosted IR経由で取得するように設定し、URLを指定します。
image.png

※Test Connection しておきましょう。

インデックスの確認

Power BI かExcelから対象のテーブルのインデックスを確認します。
Excelであれば下記
image.png

Power BI であれば下記
image.png

URLを指定します。
image.png

データの変換
image.png

詳細エディターで、インデックスを確認します
image.png

下記の数字がインデックスになります。
image.png

データセットの作成

ADFに戻って、データセットを作成します。
image.png

LinkedServiceは先ほど作ったものを選択し、インデックスは確認した「0」を入れます。
image.png

プレビュー結果はこのように出ます。クレンジングが必要そうですね。
image.png

あとはCopyアクティビティなどで、Storageに吐くもよし、Mapping Data Flowで変換してDBに書き込むもよしです。

以上

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?