WEB上の情報をまとめて取得したい!
私は現在入社2年目で旅行会社に勤務しております。(BtoC向けの旅行商品を扱う部署にてWEB販促などを担当しています。)日々の業務では、新規の特集を組むために他社サイトの動向チェックを行うことも多いのですが中々ルーティン化ができず、また今後の参考に残せるような綺麗な纏めができていないなという反省があります。 今回は、覚えたての【Power Automate Desktop】通称PADを使って業務自動化をすることで、身の回りの課題解決に挑戦しました。
尚、こちらのアイデアは、会社全体の課題をハイテク技術で解決!というより、小さな課題を一瞬で解決するということを目的としています。PADの操作を覚えてすぐに活用してみた事例となるので、【PAD初心者の方】や【自動化できそうな業務を探している方】 は是非ご覧ください。
部署内の小さな課題②
※今回の内容と同様に、PADを活用して課題解決①の解決も考えてみましたので良ければ併せてご覧ください。
/
他サイトの事例を集めるのに手間がかかる。簡単にできない??
\
具体的には…
◆他サイトで掲載中の特集ページの情報収集の時間を短縮したい
◆複数サイトにそれぞれアクセスするだけで時間がかかってしまう
◆ルーティンとしていても定期的に見にいけない時がある
以上の課題を踏まえ
サイト自体は、文字だけでない情報も多くあるため自分で確認しにいくことは必要だと感じつつも、そこから文字情報を抜き出し→Excelに纏めるという2STEPの手間をまずは削減したいと思いPADを活用してスクレイピングを行うことに挑戦しました。使用ツール
下記のサービスはインストールやアカウント登録などの事前準備が必要になります。 *Power Automate Desktop最終完成イメージ
▼以下のサイトの特集箇所から「特集タイトル」と「説明文」を抜き出しました。 ※ここでは「WEBページからデータを抽出する」のアクションを使用していますが、以下の特集のように複数同型の情報が並んでいる場合、初めの2セットを抽出した時点で全てを認識し、一つずつ最後まで選択せずとも自動で抽出をしてくれます。 ![スクリーンショット (558).png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/2496382/a0e8b9fa-8936-f5c3-2240-133557155424.png) ▼1行目に日時、2行目以降に抜き出した情報を転記させました。 ![スクリーンショット (557).png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/2496382/f8d419aa-2131-1a38-00fc-02603de901ad.png)PADのフローがこちら
【フロー開始~完了までの時間:約14秒】 ![スクレイピング.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/2496382/02443d86-24f4-ffd3-3eb1-3f1e721f1591.png)最後に
今回は、多くのWEBサイトでも既に紹介されているスクレイピングに、抽出日の記載を加えて実務に結び付けてみました。この作業を自動化することで、情報収集の時間短縮はもちろん、今後のための情報まとめにも活用できると思います。また、このフローを応用して、タブ分けで複数のサイトから情報を集めたり、週次で更新をしたりとさらなる自動化もできるかと思いました。スクレイピングについては、応用の活用法を引き続き調べて実際にフローを真似ながら習得していきます。最後までご覧いただき、ありがとうございました