automation anywhere に入門しました。 HTML Parserを使用してパースする。 #AutomationAnywhere

最近RPAを初めて触ったのですがその際に詰まった事があり、参考記事が少なかったので共有します。

依頼された要件は毎日手動更新しているものがあるので、スクレイピングをして自動化してほしいという内容です。(対象は自社サイト)
automation anywhereを使用して作成する事も要件にあり、これのみで作成しています。

作成したものの全容です。
csvのURLからサイトの特定のtextを取得してcsvに格納、更新するというものです。

csv読み込み → URLにリクエスト → 特定の値を取得する → csv更新

アクションの解説をしていきます。

csv,ループなど..プログラムの構文と同じ感じで使用できます。
REST アクションではheader、プロキシなど設定ができます。
モバイルからのアクセスが必要、URLリストが同一オリジンだった為
User-Agentとkeep-alive(HTTP/1.0の場合)を付与して送信します。

追記: 9/02
HTTP keep-alive
クライアントが接続を開いておく意思があることを示します。接続の維持は HTTP/1.1 の既定の動作です。ヘッダー名のリストは、介在する最初の非透過プロキシーやキャッシュが削除するヘッダーの名前です。既定でした
警告: Connection や Keep-Alive などの接続固有のヘッダーフィールドは、HTTP/2 では禁止されています。Chrome と Firefox は HTTP/2 レスポンスでそれらを無視しますが、Safari は HTTP/2 仕様の要件に準拠しているため、それらを含むレスポンスを読み込みません。
https://developer.mozilla.org/ja/docs/Web/HTTP/Headers/Connection
また最後の通信でConnection: closeを付与するとより早く通信を切断でき、
サーバの負荷を軽減して丁寧かもしれません。(keepalive_timeout値を確認)
またブラウザからもタイムアウト値はせっていでき、ブラウザのタイムアウト値はサーバーより短くしておきます
https://zenn.dev/forcia_tech/articles/202305_http_keepalive