2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

StudioXのデータ抽出(Data Extraction)を使ってみた

Posted at

これはUiPathのStudioXにあるデータ抽出機能の内容、簡単な操作方法の記事である。

#データ抽出(Data Extraction)とは
指定した Web ページまたはアプリケーションから表データや複数のページにわたる Web の検索結果などの構造化された情報を抽出する機能。

アクティビティ欄から選ぶ他のアクティビティとは違い上部にあるリボン帯にボタンが存在し、そのボタンから取得ウィザードを実行して、抽出する情報を指定する。
(詳しい使用方法は後述)
UiPath_StudioX画面.png

##表データとは、
例えば下記の様な行列に規則性がある表で表現されたランキングである。
表データ例.png
※Yahoo株式ランキングより

また、下記の様な検索結果も欲しいデータを指定し、StudioX側で相関性を見つけてデータを抽出することが可能である。
検索結果.png
※Goolge検索の「UiPath」検索結果より

#データ抽出(Data Extraction)の使い方

##例題:Yahoo株式ランキングよりデータを抽出したい場合

①抽出したい画面をデータ抽出操作の前に表示しておく
表データ例.png

②StudioXの「データ抽出」をクリック
UiPath_StudioX画面.png

③開いた取得ウィザード画面で「次へ」をクリック
取得ウィザード.png

④欲しいデータのヘッダー部分の一番左を選択
ヘッダーを選択.png

⑤表形式データを抽出画面で「はい」をクリック
表形式データを抽出.png

⑥抽出されたデータのプレビューを確認。最大件数も設定可能。
問題無ければ「終了」をクリック
抽出された表データ.png

⑦次へのリンクを指定で複数ページにまたがるデータを取得するか否かを選択
複数ページにまたがるデータを取得しない場合は「いいえ」を選択。
今回は操作説明の為「はい」を選択する。
複数ページ.png

⑧「次へ」ボタンを選択
次へボタン.png

⑨StudioXに下記の様な画面が作成される
データ抽出が作成.png

これでデータ抽出は完了なのだが、せっかくなのでどういう形のデータが抽出されているか、csvにアウトプットしてみる。

⑩抽出先を選択
抽出先選択.png

⑪CSVに書き込みアクティビティを追加、設定し完成
※「CSV書き込み」アクティビティの書き込み先欄にCSVの名前を設定すると、
StudioXを実行した際に、StudioXと同じフォルダの中にCSVが作成されます。
完成.png

##CSVでアウトプットした結果

Yahoo株式ランキングなどのブラウザを消し、
StudioXの上部にある「実行」を押してみましょう。
※自動的にブラウザが起動され、Yahoo株式ランキングが開きデータが抽出されます。
結果①.png
結果②.png

#終わりに
データ抽出機能は便利かつ奥深い機能です。
UiPath Studioでもデータスクレイピング(Data Scraping)という似た機能がり、もしデータ抽出に興味を持たれた方はデータスクレイピングで検索してヒントを得るのも良いかもしれません。

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?