SpringAI更新:向量数据库不可用的解决方案!
Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,更新原来的向量 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。数据
此时我们就需要一种成本更低的库不可用解决方案来解决这个问题,如何解决呢?决方我们一起来看。
解决方案:Redis 向量数据库
虽然 SimpleVectorStore 不支持了,更新但 Spring AI 内置了 Redis 或 ES 作为向量数据库的向量分布式存储中间件,我们可以用他们来进行向量的数据存储。
而在这两种方案中,库不可用显然 Redis 使用成本更低,决方因此,更新我们来看如何将向量存储到 Redis 数据库中。向量
它的数据具体实现步骤如下。服务器托管
安装Redis-Stack
下载 Docker Hub:https://www.docker.com/get-started/
图片
添加依赖
我们使用阿里云百炼平台的决方嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的,因此,我们需要添加 OpenAI 和 Redis Vector 依赖:
复制<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-starter-vector-store-redis</artifactId> </dependency> <dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-starter-model-openai</artifactId> </dependency>1.2.3.4.5.6.7.8.9.设置配置信息
配置 Redis 连接信息,以及嵌入模型的配置信息:
复制spring: data: redis: host: localhost port: 6379 ai: vectorstore: redis: initialize-schema: true index-name: custom-index prefix: custom-prefix openai: api-key: ${ALIYUN-AK} embedding: options: model: text-embedding-v31.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.阿里云百炼平台支持的向量模型:
图片
代码实现
Redis 添加向量数据
复制@Autowired private VectorStore vectorStore; // 构建数据 List<Document> documents = List.of(new Document("I like Spring Boot"), new Document("I love Java")); // 添加到向量数据库 vectorStore.add(documents);1.2.3.4.5.6.7.8.9.当然,向量数据的数据源可以是文件、图片、音频等资源,这里为了简单演示整体执行流程,使用了更简单直观的源码库文本作为数据源。
VectorStore 提供的常用方法如下:
add(Listdocuments):添加文档。delete(ListidList):按 ID 删除文档。delete(Filter.Expression filterExpression):按过滤表达式删除文档。similaritySearch(String query) 和 similaritySearch(SearchRequest request):相似性搜索。执行结果如下:
图片
查询向量数据
复制@RestController @RequestMapping("/vector") public class VectorController { @Resource private VectorStore vectorStore; @RequestMapping("/find") public List find(@RequestParam String query) { // 构建搜索请求,设置查询文本和返回的文档数量 SearchRequest request = SearchRequest.builder() .query(query) .topK(3) .build(); List<Document> result = vectorStore.similaritySearch(request); System.out.println(result); return result; } }1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.执行结果如下:
图片
从上述结果可以看出,和“java”相似度最高的向量为“I love Java”,相似度评分为 0.77,如果我们 SearchRequest 对象中的 topK 设置为 1 的话,只会查询“I love Java”这条数据,如下图所示:
图片
本文地址:http://www.bhae.cn/html/942c7998978.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。