0
0

Databricksのデータ追加UIでXMLファイルがサポートされました

Posted at

こちらのアップデートです。

Add data UI supports XML file format

サイドメニューで +新規 > ファイルアップロード を選択します。
Screenshot 2024-02-25 at 9.44.26.png

ファイルアップロードUIが表示されます。XMLが追加されています。
Screenshot 2024-02-25 at 9.50.28.png

こちらのXMLを使います。コピーしてPurchaseOrders.xmlとしてファイルに保存します。

PurchaseOrders.xml
<?xml version="1.0"?>
<PurchaseOrders>
  <PurchaseOrder PurchaseOrderNumber="99503" OrderDate="1999-10-20">
    <Address Type="Shipping">
      <Name>Ellen Adams</Name>
      <Street>123 Maple Street</Street>
      <City>Mill Valley</City>
      <State>CA</State>
      <Zip>10999</Zip>
      <Country>USA</Country>
    </Address>
    <Address Type="Billing">
      <Name>Tai Yee</Name>
      <Street>8 Oak Avenue</Street>
      <City>Old Town</City>
      <State>PA</State>
      <Zip>95819</Zip>
      <Country>USA</Country>
    </Address>
    <DeliveryNotes>Please leave packages in shed by driveway.</DeliveryNotes>
    <Items>
      <Item PartNumber="872-AA">
        <ProductName>Lawnmower</ProductName>
        <Quantity>1</Quantity>
        <USPrice>148.95</USPrice>
        <Comment>Confirm this is electric</Comment>
      </Item>
      <Item PartNumber="926-AA">
        <ProductName>Baby Monitor</ProductName>
        <Quantity>2</Quantity>
        <USPrice>39.98</USPrice>
        <ShipDate>1999-05-21</ShipDate>
      </Item>
    </Items>
  </PurchaseOrder>
  <PurchaseOrder PurchaseOrderNumber="99505" OrderDate="1999-10-22">
    <Address Type="Shipping">
      <Name>Cristian Osorio</Name>
      <Street>456 Main Street</Street>
      <City>Buffalo</City>
      <State>NY</State>
      <Zip>98112</Zip>
      <Country>USA</Country>
    </Address>
    <Address Type="Billing">
      <Name>Cristian Osorio</Name>
      <Street>456 Main Street</Street>
      <City>Buffalo</City>
      <State>NY</State>
      <Zip>98112</Zip>
      <Country>USA</Country>
    </Address>
    <DeliveryNotes>Please notify me before shipping.</DeliveryNotes>
    <Items>
      <Item PartNumber="456-NM">
        <ProductName>Power Supply</ProductName>
        <Quantity>1</Quantity>
        <USPrice>45.99</USPrice>
      </Item>
    </Items>
  </PurchaseOrder>
  <PurchaseOrder PurchaseOrderNumber="99504" OrderDate="1999-10-22">
    <Address Type="Shipping">
      <Name>Jessica Arnold</Name>
      <Street>4055 Madison Ave</Street>
      <City>Seattle</City>
      <State>WA</State>
      <Zip>98112</Zip>
      <Country>USA</Country>
    </Address>
    <Address Type="Billing">
      <Name>Jessica Arnold</Name>
      <Street>4055 Madison Ave</Street>
      <City>Buffalo</City>
      <State>NY</State>
      <Zip>98112</Zip>
      <Country>USA</Country>
    </Address>
    <Items>
      <Item PartNumber="898-AZ">
        <ProductName>Computer Keyboard</ProductName>
        <Quantity>1</Quantity>
        <USPrice>29.99</USPrice>
      </Item>
      <Item PartNumber="898-AM">
        <ProductName>Wireless Mouse</ProductName>
        <Quantity>1</Quantity>
        <USPrice>14.99</USPrice>
      </Item>
    </Items>
  </PurchaseOrder>
</PurchaseOrders>

ファイルをドラッグ&ドロップします。
Screenshot 2024-02-25 at 9.52.13.png

テーブルを作成するカタログやスキーマを選択します。もう一つ重要な設定が行タグです。XMLで行を構成するタグをここで指定します。説明文。

行として扱う行タグ。例えば、このXML <books><book></book><book></book>...</books>の場合、値は「book」となります。

上のXMLではPurchaseOrderとなります。行タグを指定すると、それに従ってデータのプレビューが表示されます。
Screenshot 2024-02-25 at 9.55.09.png

また、詳細な属性をクリックするとXMLパーシングの挙動を制御できます。
Screenshot 2024-02-25 at 9.56.46.png

テーブルを作成をクリックします。
Screenshot 2024-02-25 at 9.57.58.png

テーブルとして登録されました!
Screenshot 2024-02-25 at 9.59.30.png
Screenshot 2024-02-25 at 10.00.01.png

DatabricksではXMLに対するクエリーもサポートしているので、子要素に直接アクセスできます。
Screenshot 2024-02-25 at 10.03.55.png

ご活用ください!

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0