DataStax Langflow とは
ドラッグアンドドロップで、生成 AI を利用したチャットボットや RAG を構築できる Langflow をクラウドでホストし、インフラを気にすることなく利用できるのが DataStax Langflow です。9/5 時点では Preview なので本番環境での利用は推奨されませんが無料で試すことができます。興味がある方は DataStax Langflow の GET STARTED WITH CLOUD からアカウント登録して利用できます。
DataStax Langflow を使うメリットとしては以下のようなものがあります。
LangChain を簡単に使える
LangChain と GenAI に関する様々なツールをドラッグ&ドロップで操作でき、あらかじめ準備されたテンプレートから構築を始めることができます。
セットアップ不要
インストールや複雑な設定は不要で、開発者はセットアップの手間をかけずにすぐにアプリの構築に取りかかることができます。様々なライブラリのバージョン管理などに悩まされることはないです。
セキュアな環境
安全で信頼性の高いクラウドプラットフォームを活用することができ、アクセスを管理することができます。
Astra DB へのシームレスなアクセス
ベクトルデータベースである Astra DB を Langflow 内で簡単に利用することができます。
柔軟性と選択肢
ベクトルデータベース、Embeddings モデル、LLM の幅広い選択肢を利用することができます。
DataStax Langflow Update
2024年9月4日にニューヨークで行われた DataStax の RAG++ というイベントで以下のアップデートが発表されました。それぞれについて紹介していきます。
-
DataStax Langflow API
Langflow で作成した生成 AI のアプリケーションを API 化して、どこからでもアクセスできる URL を発行します。API にはトークンが設定されるので、URLとトークンを知っている人しかアクセスできません。 -
Unstructured との統合
RAG を構築する際に、元となるデータはすぐにベクトル化できるようなテキストファイルとは限らず、HTML, PDF, CSV, PNG, PPTX のような複雑な構造をしている可能性があります。これらのファイルからの情報抽出を簡単かつ適切に行う Unstructured というライブラリを使えるようになりました。
DataStax Langflow API
DataStax のアカウント登録が終わってログインすると Astra DB の画面に移動します。メインの画面に「Build with Langflow」という紫のボタンが現れるので、これをクリックして Langflow の画面に移動します。既存のプロジェクトの中から一つを選択するか、まだプロジェクトがない場合は新しいプロジェクトを作成しましょう。
Langflow のプロジェクトを作成すると、以下のようなアプリケーション作成画面が現れます。作成の例は、前回の Qiita の記事「Astra DB と Langflow で RAG を構築」を見てください。
アプリケーションができたら画面右下の Playground からチャットのインタフェースを試すことができます。そして今回のアップデートである DataStax Langflow API を試すには、その横の </> API をクリックすると以下のような画面が現れます。
API を利用するにはトークンが必要になるので、Generate Token からトークンを生成して利用します。その下には cURL や Python などを使った API の利用方法が表示されています。
それでは cURL を使って実際に API を利用してみましょう。 を生成したトークンに置き換えてください。また、"input_value" が "message" に設定されているので、これをフローに送信したいメッセージに更新してコマンドを実行します。JSON のフォーマットに変換するために、jq JSON processorを使用すると便利かもしれません。
cURL でリクエストを送ると RAG の結果が返ってきました!
Unstructured との統合
Unstructured を利用したデータの読み込み自体は、OSS の Langflow v.1.0.16 から利用可能で、同様の機能が DataStax Langflow でも可能です。以下のように Loaders に Unstructured のコンポーネントがあるのでドラッグアンドドロップで追加できます。Unstructured のコンポーネントの特徴としては以下があります。
-
幅広いファイルサポート
PDF、画像、動画、Word文書、PowerPointプレゼンテーションなど、さまざまなファイルタイプをアップロードできます。 -
クラウドまたはローカル処理の選択
DataStax ローカルの Unstructured を使用することも、Unstructured APIキーを使用して処理することも可能です。 -
シームレスな統合
処理されたJSON出力をAstra DBに簡単に保存し、GenAIアプリケーションで使用できます。
シームレスな統合の部分に関しては、Langflow を使わなくても、Astra DB に対して直接 PDF をアップロードしてベクトル化し、ベクトルデータを登録することもできます。これは Astra DB のポータル画面から数回のクリックでアップロード画面を開いて実施することができます。100 PDF までは同時にインポートできます。
まとめ
DataStax Langflow API と Unstructured との統合についての新機能を紹介しました。
DataStax Langflow API は、Langflowで作成した生成AIアプリケーションをAPI化し、どこからでもアクセス可能なURLを発行します。APIにはトークンが設定され、URLとトークンを知っている人だけがアクセスできます。また、Unstructuredライブラリを利用することで、HTML、PDF、CSV、PNG、PPTXなどの複雑なファイルから情報を抽出し、RAGを構築できます。