ChromaDBとは
ChromaDBは、ベクトル埋め込みを格納し、大規模な言語モデル(LLM)アプリケーションを開発・構築するために設計されたオープンソースのベクトルデータベースです。ChromaDBは、LLMアプリケーションを構築するための強力なツールです。高速で効率的で使いやすな特徴を持っています。
ChromaDBの特徴
- 高速で効率的: ChromaDBは、人気のあるインメモリデータストアであるRedisの上に構築されています。これにより、埋め込みの格納とクエリが非常に高速に行えます。
使いやすさ: ChromaDBにはシンプルで直感的なAPIが備わっており、初めてでも簡単に始めることができます。 - 複数の埋め込みフォーマットのサポート: ChromaDBは、Word2VecやGloVe、FastTextなど、さまざまな埋め込みフォーマットをサポートしています。
- 最近傍探索のサポート: ChromaDBは、指定された埋め込みの最近傍を見つけるために使用できます。これは、セマンティック検索や質問応答などのアプリケーションに役立ちます。
- 増分更新のサポート: ChromaDBは増分で更新することが可能です。これにより、頻繁に更新が必要なアプリケーションに適しています。
- レプリケーションのサポート: ChromaDBは複数のサーバーにレプリケーションでき、高い可用性と耐障害性を提供します。
- ハイブリッドクラウドのサポート: ChromaDBはローカルおよびクラウドの両方で使用することができます。
ChromaDBの完全なチュートリアル
- ChromaDB 概要
- ChromaDBとは
- ChromaDBの特徴
- Language Support
- 環境構築
- データセット
- 埋め込み(エンベディング
- ChromaDB 関数
- Clientのメソッド
- EphemeralClient
- create_collection
- heartbeat
- reset
- get_collection
- get_or_create_collection
- list_collections
- delete_collection
- コレクションのメソッド
- add
- peek
- count
- modify
- get
- query
- delete
- update
- upsert
- 埋め込み
- DefaultEmbeddingFunction
- SentenceTransformerEmbeddingFunction
- OpenAI
参照:
- Chroma docs: https://docs.trychroma.com/
- api-reference: https://docs.trychroma.com/api-reference
- datasets: https://huggingface.co/datasets/jingwora/unstructured-data-multilingual