LoginSignup
2
1
生成AIに関する記事を書こう!
Qiita Engineer Festa20242024年7月17日まで開催中!

[Dify] v0.6.11でリリースされた目玉機能「Webサイトから同期」と「ワークフローにメモ追加」を解説

Posted at

はじめに

今回はリリース機能を一部まとめてみました。
全リリース内容は以下を参照してください。
https://github.com/langgenius/dify/releases/tag/0.6.11

リリースのアナウンスはDiscordに入っているとめちゃくちゃ気づきやすいのでおすすめです!
Discordはこちら

では初めていきます。

Webサイトから同期

Webサイトから同期の機能はみなさん待望の機能ですね!
特定のURLを入力すると、そのURLからいい感じにサイト内をクロールし、内容をベクトルDBに格納しておく機能です!
これがあることでLLMが知らないような最新の情報などを回答するようなRAGを構築するのがめちゃくちゃ楽になりますね!
LangGraphとか最近出てきてめちゃくちゃ使われるツールなどはこれでめちゃくちゃ捗りますね。
では使い方解説です。

  1. FireCrawlの設定に移動する。
    image.png

  2. APIキーを設定する。
    基本はAPIキーの設定だけで大丈夫です!FireCrawlをセルフホスティングしている場合はBaseURLが必要になります。
    image.png

  3. ナレッジのWebサイトから同期に移動。ベクトルDBに格納したいURLを入力する。
    基本的にFireCrawlは入力したURLを元にして、パスを探索していきます。探索する時の設定はオプションから設定できます。
    オプションは以下。

  • Crawl sub-pages: サブページもクロールするかどうかを指定します。
  • Limit: クロールするページの最大数を指定します(必須項目)。
  • Max depth: クロールの深さを指定します。
  • Exclude paths: クロールしないパスを指定します(例: blog/, about/)。
  • Include only paths: クロールするパスを指定します(例: articles/*)。
  • Extract only main content: メインコンテンツのみを抽出するかどうかを指定します(ヘッダー、ナビゲーション、フッターなどを除外)。
    image.png

4. こんな感じで取得できます。
image.png

ワークフローにメモ追加

正直これはすぐには使わなさそうな機能です。
ただチームでDifyを使う時や、社内でDifyを使う時などは重宝されそうです!
使い方は簡単。以下の画像のようにメモを追加ボタンをクリックするだけ!
書き心地は普通のマークダウンエディターなので良いです!
image.png

他のアップデート

GPT-4oでまとめさせました。

Model Support

  • Jina: Jina-CLIP-v1モデル対応。
  • Zhipu: GLM4新モデルとZhipu embedding-2追加。
  • ERNIE-4.0-8K-Latest: ERNIE-4.0-8K-Latest対応。
  • Doubao: Doubao LLMの機能呼び出し対応。
  • Hunyuan: Hunyuan LLMモデル対応。
  • SiliconFlow: SiliconFlow対応。
  • Novita.ai: Novita.aiをモデルプロバイダーとして追加。

🛠️ ツール

  • DuckDuckGo: 画像検索、翻訳、AIチャットツール追加。
  • Feishu: 多次元表操作ツール追加。

🗄️ ベクターデータベース

  • TiDB Vector: TiDB vector対応。
  • Chroma Vector Store: Chroma vector store対応。
  • Tencent Vector DB: Tencent vector DB対応。

☁️ AWS

  • EKS Pod Identity: boto3ライブラリをEKS Pod Identity対応にアップグレード。
  • IAM Role for Bedrock: IAM Role for Bedrock使用可能に。
  • AWS S3 IAM Check: AWS S3 IAMチェック追加。

🏗️ APIサービスインフラ

  • Poetry Support: Poetryビルドツール対応。
  • 次バージョンでpipは主要パッケージ管理ツールから除外予定。
  • Poetry in CI: CIジョブで依存関係インストールにPoetryをデフォルト使用。
  • Pydantic Migration: バリデーションをPydantic 1.xから2.xに移行。

その他の強化

  • Editor User Permission: 新しい編集者ユーザーパーミッションプロファイル追加。
  • Memory Messages Limit: デフォルトのメッセージ数制限を無限に設定。
  • DOCX Image Handling: DOCX画像抽出時の外部画像処理改善。
  • Dataset Delete Endpoint: データセット削除エンドポイント追加。
  • Knowledge Retrieval: データセットクエリをバッチ処理で知識検索性能を最適化。
  • Jina Tools: APIキー、プロキシサーバー、キャッシュバイパスパラメータ追加。
    = HTTP Request Fix: HTTPリクエストのDELETEメソッドが動作しない問題を修正。
2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1