4
2
生成AIに関する記事を書こう!
Qiita Engineer Festa20242024年7月17日まで開催中!

Difyを用いた、URLからテキスト抽出を行うアプリケーション

Posted at

はじめに

今回は、Difyを用いてURLからテキスト抽出を行うアプリケーションを実行した。

Difyの詳細については、以下の通りである。

以下に、導入を示す。

導入

今回は「ワークフロー」のタイプで作成した。
アプリケーションの全体像は以下のようになっている。
image.png

開始の部分では、変数名を input とした。
ラベル名を、 メッセージを入力してください。URLが入力されれば、そのURLのテキストを抽出し、出力します。 とした。
最大長は256にした。
image.png

質問分類器の部分では、開始部分の変数inputに、
①URLが入力された場合
②URL以外の情報が入力された場合
の2つの場合をLLMが分類し、それぞれ処理を実行する。
image.png

①URLが入力された場合
今回はURLからテキストを抽出するために、JinaReaderを実行した。
JinaReaderは、指定されたURLからメインのテキストを抽出することができるツールである。

開始部分の変数inputを入力変数に入力するだけで、URLからテキストを抽出することができる。

image.png

JinaReaderでテキストを抽出し出力した場合、出力結果は以下のようになる。
なお、URLは以下のサイトを使用した。

image.png

この出力結果をより分かりやすく表示するために、LLMを使用する。
USERの部分に、 {x}textで抽出されたテキストのみを出力して と入力する。

image.png

終了部分では、LLMによって得られた回答を出力する。
image.png

②URL以外の情報が入力された場合
開始部分の変数inputでURL以外の情報が入力された場合は、入力された質問に答えてもらう。
image.png

終了部分では、答えてもらった質問を出力する。
image.png

実行結果

①URLが入力された場合
入力されたURLのテキストを抽出し、出力する。
image.png

②URL以外の情報が入力された場合
入力された質問に答える。
image.png

まとめ

今回は、Difyを用いてURLからテキスト抽出を行うアプリケーションを実行した。
今後はこの機能の他にも、URLの情報の概要を出力し、プレゼンテーションの原稿を作成するといった機能を持つようなアプリケーションを作成していきたい。

4
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
2