これはUiPathのStudioXにあるデータ抽出機能の内容、簡単な操作方法の記事である。
#データ抽出(Data Extraction)とは
指定した Web ページまたはアプリケーションから表データや複数のページにわたる Web の検索結果などの構造化された情報を抽出する機能。
アクティビティ欄から選ぶ他のアクティビティとは違い上部にあるリボン帯にボタンが存在し、そのボタンから取得ウィザードを実行して、抽出する情報を指定する。
(詳しい使用方法は後述)
##表データとは、
例えば下記の様な行列に規則性がある表で表現されたランキングである。
※Yahoo株式ランキングより
また、下記の様な検索結果も欲しいデータを指定し、StudioX側で相関性を見つけてデータを抽出することが可能である。
※Goolge検索の「UiPath」検索結果より
#データ抽出(Data Extraction)の使い方
##例題:Yahoo株式ランキングよりデータを抽出したい場合
⑥抽出されたデータのプレビューを確認。最大件数も設定可能。
問題無ければ「終了」をクリック
⑦次へのリンクを指定で複数ページにまたがるデータを取得するか否かを選択
複数ページにまたがるデータを取得しない場合は「いいえ」を選択。
今回は操作説明の為「はい」を選択する。
これでデータ抽出は完了なのだが、せっかくなのでどういう形のデータが抽出されているか、csvにアウトプットしてみる。
⑪CSVに書き込みアクティビティを追加、設定し完成
※「CSV書き込み」アクティビティの書き込み先欄にCSVの名前を設定すると、
StudioXを実行した際に、StudioXと同じフォルダの中にCSVが作成されます。
##CSVでアウトプットした結果
Yahoo株式ランキングなどのブラウザを消し、
StudioXの上部にある「実行」を押してみましょう。
※自動的にブラウザが起動され、Yahoo株式ランキングが開きデータが抽出されます。
#終わりに
データ抽出機能は便利かつ奥深い機能です。
UiPath Studioでもデータスクレイピング(Data Scraping)という似た機能がり、もしデータ抽出に興味を持たれた方はデータスクレイピングで検索してヒントを得るのも良いかもしれません。