著者:Yawen、Difyプロダクトチーム
本日、Dify v1.1.0をリリースします。メタデータをナレッジフィルターとして活用することで、精密なデータフィルタリングとアクセス制御を実現し、検索精度・セキュリティ・効率性を向上。効果的な検索拡張生成(RAG)管理に不可欠な機能です。
本回、メタデータフィルタリング機能を搭載したDify v1.1.0のリリースをお知らせします。この新機能により、カスタムメタデータ属性を活用したナレッジベースの関連データ検索精度が大幅に向上。従来ユーザーは特定条件での絞り込みができず、大規模データ全体を検索する必要がありましたが、メタデータによるタグ付けと分類で検索効率と精度が改善されます。特に大量情報の管理が求められる検索拡張生成(RAG)システムにおいて重要な進化です。
メタデータフィルタリングの仕組み
メタデータとは「データに関するデータ」を指します。主要データを説明する追加の文脈や属性を提供し、より精密な検索と取得を可能にします。例えば文書管理システムでは、文書名・作成者・作成日などがメタデータに該当します。この構造化された情報により、システムは特定基準に基づいた結果のフィルタリングが可能になり、取得コンテンツの関連性が向上します。
メタデータフィルタリングのメリット
メタデータフィルタリングは、関連文書の迅速な特定と無関係な結果の排除による検索精度向上、権限管理強化によるデータセキュリティの向上、クエリ範囲の最適化による検索パフォーマンス改善という3つの主要メリットを提供します。特に企業環境では、大規模文書リポジトリを直感的にナビゲートできることでユーザー体験が向上します。
下図はアクセス制御の比較を示しており、メタデータフィルタリングによるきめ細かい権限管理の仕組みを説明しています。privacylevel、uploader、update_dateの3つのフィルタリング基準を適用した例では、privacylevelの調整により「RAG 2.0ロードマップ」へのユーザーアクセスを制御できます。これにより管理者は特定情報の取得範囲を精密に管理でき、データアクセスの安全性と効率性を両立できます。
要約すると、メタデータは文脈レイヤーとアクセス制御を追加することで、より知的で安全かつ効率的な情報検索を実現するインテリジェントフィルターとして機能します。ナレッジのプライバシー保護と関連性維持が不可欠な検索拡張生成(RAG)システムにおいて、特に重要な役割を果たします。
メタデータをナレッジフィルターとして活用する方法
ステップ1:ナレッジベース文書へのメタデータ追加
ナレッジベース内の文書にメタデータを追加・管理できます。各文書には作成時にファイル名・アップローダー・アップロード日などの基本メタデータが自動付与されます。ユーザーは新規メタデータフィールドの手動追加、フィールド名とデータタイプの設定、既存文書の一括編集が可能です。このタグ付けプロセスにより構造化情報が付加され、後の検索・管理が容易になります。
ステップ2:アプリケーションでのメタデータフィルタリング設定
チャットボットのコンテキスト設定や、チャットフローおよワークフローのナレッジ検索ノードでメタデータフィルタリングを設定可能です。自動モードではユーザークエリからフィルタリング条件を自動抽出、手動モードでは文字列・数値・時間の各データタイプに基づき条件を設定し、複数条件間の論理関係(AND/OR)を指定できます。
3種類のメタデータと活用事例
当社がサポートする文字列・数値・時間の3タイプメタデータは、実際のユースケースに応じて柔軟に活用できます。主な活用事例をご紹介します:
-
文字列メタデータ - 文脈関連性向上
「プロジェクトレポート」検索時に「マーケティング」や「研究開発」タグで部門別フィルタリングし、無関係情報を排除 -
数値メタデータ - アクセス制御強化
プライバシーレベルの数値閾値を設定し、権限のないユーザーが機密文書にアクセスできないよう制限 -
時間メタデータ - バージョン管理
更新日時によるフィルタリングで最新版文書を優先表示。同一アップローダーの複数バージョン文書を比較検索するテストにも活用可能
詳細な操作手順については、ナレッジベース|Difyドキュメントをご参照いただき、ぜひDify.AIでお試しください!