0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

WorkatoAdvent Calendar 2024

Day 23

Workatoでリンク先を読み込んでAI活用する

Last updated at Posted at 2024-12-23

はじめに

必要な情報を効率よく収集し、定期的にキャッチアップすることは、企業活動やプロジェクト運営に欠かせない作業の一つです。
例えば、あるサイトの内容を自動で読み取って要約したり、必要なデータの収集まで行ってくれる仕組みがあれば、多忙な業務の中でもタイムパフォーマンスを向上させることができます。

昨今では自動化フローにAIを組み込むことで、さまざまな処理を効率化することが一般的になっていますが、ChatGPT(OpenAIのAPI経由)は指定の外部サイトへのアクセスやスクレイピング機能を備えていません。プロンプトでURLを指定しても見に行ってくれないのです。

そのため、指定のリンク先を読みに行きデータを取得する処理については、何らかの外部ツールで実装しなければなりませんが、実はWorkatoのある機能を利用することで実現できます。

本記事では実装方法と、AIとを掛け合わせた活用ケースについてご紹介します。

使用するアクション

「File tools by Workato」コネクタの、「Get file from URL」アクションを使用します。
ファイルをダウンロードするための機能ですが、要は指定されたリンク先の情報を取得するものです。ファイルのURLの代わりにWebサイトのURLを与えることでWebページの読み込みが可能です。

本来の使い方(ファイルのダウンロード)については、以下の記事が参考になります。

Webページを読み込むことができるとお伝えしましたが、以下の点に注意が必要です。

向いていないケース

  • ログインや認証が必要なページ
    認証情報が必要なページにはアクセスできません。
  • JavaScriptによって動的に生成されるページ
    JavaScriptなどのクライアントサイドスクリプトによってコンテンツが動的に生成されるページには対応していません。
  • 複数ページにわたるコンテンツ
    ページ送りができないため、複数ページにまたがる情報の読み込みには対応していません。先頭ページのテキストのみが読み込まれ、不完全なデータとなる場合があります。

これらのケースの実現には、RPAやSeleniumなどを使ったスクレイピング技術が必要です。

向いているケース

したがって、当アクションを使う際は内容が1ページに収まった静的なページを対象として、効率的にWebデータを抽出することを推奨します。

使い方

Webページの読み込みに続けて、読み込んだデータをデコードする処理も併せて実装します。

image.png

1. Webページを読み込む

image.png

2. 読み込んだデータをデコードする

image.png

活用例①:リンク先を要約する

RSSやAtomで配信されたフィードの新着記事を読み込み、その要約をSlackで通知するレシピです。
記事のURLをクリックして全文を読まなくても、概要が把握できます。
例)競合企業のニュースリリースなどのモニタリング

▼読込対象の記事

▼Workatoで投稿されたメッセージ

image.png

レシピ

この例では、当社運営のブログのフィードを取得しています。
スクリーンショット 2024-12-13 153905.png

処理の詳細

各Stepの詳細はこちら(折りたたまれています)
  • Step1) 新着記事キャッチ
    image.png

  • Step2~3) ページ読込とデコード
    image.png

  • Step4) 要約前の準備として、記事本文を抽出
    image.png

  • Step5~6) 記事をAIで要約、Slack通知
    image.png

活用例②:特定のWebページを監視する

新着情報を把握する方法としてはRSSやメールマガジン配信サービスを利用するのが一般的ですが、サイトによってはRSSが提供されていない場合や、配信される内容が業務上必要な情報に十分対応していない場合もあります。
「このページの、ここが変わったら知りたいんだよな」というピンポイントなニーズに応える一例として紹介します。

対象のページ

日本銀行HPの下記ページでは、データ系列数が多量にのぼる統計(物価統計、資金循環統計、短観、国際収支統計、BIS関連統計)について、一括ダウンロードが可能となっています。

いくつかのテーブルに分かれ、「統計の名称」と「最終更新日付」が記載されているのが特徴的です。

image.png

実行結果

上記Webページで前日に更新された統計をピックアップして通知する処理をWorkatoで構築すると、次のような通知が届きます。

▼対象データ
(実行日が2024年12月12日の場合、12月11日に更新されたデータが該当します)
image.png

▼Workatoで投稿されたメッセージ
image.png

レシピ

image.png

処理の詳細

各Stepの詳細はこちら(折りたたまれています)
  • Step2~3) ページ読込とデコード
    image.png

  • Step4) AIでぺージ全体から統計リストを生成
    image.png

  • Step5~6) 条件に合う統計データをSlack通知
    image.png

format_mapformulaの使い方については、下記の記事で紹介しています。

WorkatoでSlack等の複数メンションを動的に生成する

補足

Step4では、AIの力を借りて必要なデータを難なく構造化しています。
新しく統計テーブルが追加されたり、ページの構成に多少の変更があった場合でも対応できる柔軟性があり、AIの恩恵を実感できる部分ですね。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?