开发喵星球

向量数据库Chroma教程

向量数据库Chroma教程

Chroma 是 AI 原生的开源矢量数据库。Chroma 使知识、事实和技能可插入 LLM,从而可以轻松构建 LLM 应用程序。

image-20240617145637531

Chroma 可以提供以下工具:

Chroma 优先考虑:

Chroma快速上手

官方示例

Python

在 Python 中,Chroma 可以在 Python 脚本中运行或作为服务器运行。

pip install chromadb

JavaScript

在 JavaScript 中,使用 Chroma JS/TS 客户端连接到 Chroma 服务器。

yarn install chromadb chromadb-default-embed 

完整示例

这里我自己的demo是采用python完成的

pip install chromadb

直接运行如下代码,便是一个完整的Demo:

import chromadb
chroma_client = chromadb.Client()

collection = chroma_client.create_collection(name="my_collection")

collection.add(
    documents=["This is a document about engineer", "This is a document about steak"],
    metadatas=[{"source": "doc1"}, {"source": "doc2"}],
    ids=["id1", "id2"]
)

results = collection.query(
    query_texts=["Which food is the best?"],
    n_results=2
)

print(results)

可以看到这里我提交了两个文档:“doc1”,“doc2”,这里是为了简单文档中只有两个字符串:”This is a document about engineer”, “This is a document about steak”。提问内容为:Which food is the best?

返回结果

{
 'ids': [
  ['id2', 'id1']
 ],
 'distances': [
  [1.5835548639297485, 2.1740970611572266]
 ],
 'metadatas': [
  [{
   'source': 'doc2'
  }, {
   'source': 'doc1'
  }]
 ],
 'embeddings': None,
 'documents': [
  ['This is a document about steak', 'This is a document about engineer']
 ]
}

这样就被正确的返回了

   
分类:玩技术 作者:荡荡, 浩浩 发表于:2024-06-19 14:35:16 阅读量:121
<<   >>


powered by kaifamiao