はじめに
今回は、Difyを用いてURLからテキスト抽出を行うアプリケーションを実行した。
Difyの詳細については、以下の通りである。
以下に、導入を示す。
導入
今回は「ワークフロー」のタイプで作成した。
アプリケーションの全体像は以下のようになっている。
開始の部分では、変数名を input とした。
ラベル名を、 メッセージを入力してください。URLが入力されれば、そのURLのテキストを抽出し、出力します。 とした。
最大長は256にした。
質問分類器の部分では、開始部分の変数inputに、
①URLが入力された場合
②URL以外の情報が入力された場合
の2つの場合をLLMが分類し、それぞれ処理を実行する。
①URLが入力された場合
今回はURLからテキストを抽出するために、JinaReaderを実行した。
JinaReaderは、指定されたURLからメインのテキストを抽出することができるツールである。
開始部分の変数inputを入力変数に入力するだけで、URLからテキストを抽出することができる。
JinaReaderでテキストを抽出し出力した場合、出力結果は以下のようになる。
なお、URLは以下のサイトを使用した。
この出力結果をより分かりやすく表示するために、LLMを使用する。
USERの部分に、 {x}textで抽出されたテキストのみを出力して と入力する。
②URL以外の情報が入力された場合
開始部分の変数inputでURL以外の情報が入力された場合は、入力された質問に答えてもらう。
実行結果
①URLが入力された場合
入力されたURLのテキストを抽出し、出力する。
②URL以外の情報が入力された場合
入力された質問に答える。
まとめ
今回は、Difyを用いてURLからテキスト抽出を行うアプリケーションを実行した。
今後はこの機能の他にも、URLの情報の概要を出力し、プレゼンテーションの原稿を作成するといった機能を持つようなアプリケーションを作成していきたい。