0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

XplentyによるXMLデータ処理

Last updated at Posted at 2020-11-30

Xplentyでは、CSVファイルの他にJSONやXMLデータフォーマットを簡単に処理することができます。この記事ではXplentyでXMLを処理しやすくする機能を例に紹介します。

#概要とリソース
デモのために、処理するサンプルXMLファイルへのリンクはこちらです。

ファイルは以下の画像のようなXML構造になっています。
image.png

このデータを処理するための鍵となるのが、Xplentyの関数「XPath」と「XPathToBag」です。これらをデータパイプラインで検証してみましょう。

Setting up the Xplenty Data Pipeline
#Xplentyデータパイプラインの設定
image.png

Xplentyパイプラインの構成要素をそれぞれ順番に説明していきます。

  1. XML_Source: 上記で共有されたリンクからのXMLファイルをクラウドストレージにコピーし、File Storage Source Componentを使用して読み込みます。

  2. XPathToBag: このステップでは、XPath /catalog/bookに一致するようにXPathToBag関数を呼び出します。これは、Bagデータ型の<catalog> </catalog>の下にあるすべての書籍を取得します。 例) XPathToBag(data,'/catalog/book')

  3. Flatten_Books: Flatten()関数を使用して、構造体の各レコードを個別のbookレコードとして取得します。 
    image.png

  4. XPath: このステップでは、XPath関数を使用して、book構造体の個々の要素を取得することができます。ここでは、上記の<book> </book>構造体にXPathを設定したコンポーネントを見てみましょう。
    image.pngXPathとその例についての追加のリファレンスは、freeformatter.comのようなXPath評価ツールを参照してください。

  5. Destination: XML から処理された個々のフィールドは、Destination(この例では BigQuery テーブル)に保存されます。

以下の画像は、出力されたレコードの例を示しています。
image.png

ファイルやAPIレスポンスからXMLをパースしてテーブル形式の構造に変換することは、データを検索する上で重要です。また、他のデータセットとのブレンドにより、データ分析をより容易にすることができます。

#まとめ
信頼できるドキュメントベースの情報転送として、XMLベースのファイルやAPIがユースケースとしてよく見られます。XplentyではこうしたXMLデータを簡単に処理するための機能が用意されています。ぜひ、Xplentyのフリートライアルでお試しください。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?