• SpringAI更新:向量数据库不可用的解决方案!

SpringAI更新:向量数据库不可用的解决方案!

2025-04-27 10:40:28 栏目:宝塔面板 1 阅读

Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,原来的 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。

此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。

解决方案:Redis 向量数据库

虽然 SimpleVectorStore 不支持了,但 Spring AI 内置了 Redis 或 ES 作为向量数据库的分布式存储中间件,我们可以用他们来进行向量的存储。

而在这两种方案中,显然 Redis 使用成本更低,因此,我们来看如何将向量存储到 Redis 数据库中。

它的具体实现步骤如下。

安装Redis-Stack

  1. 下载 Docker Hub:https://www.docker.com/get-started/

图片

  1. 安装 redis-stack-server:使用“docker run -d --name redis-stack-server -p 6379:6379 redis/redis-stack-server”。

添加依赖

我们使用阿里云百炼平台的嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的,因此,我们需要添加 OpenAI 和 Redis Vector 依赖:


  org.springframework.ai
  spring-ai-starter-vector-store-redis



  org.springframework.ai
  spring-ai-starter-model-openai

设置配置信息

配置 Redis 连接信息,以及嵌入模型的配置信息:

spring:
  data:
    redis:
      host: localhost
      port: 6379
  ai:
    vectorstore:
      redis:
        initialize-schema: true
        index-name: custom-index
        prefix: custom-prefix
    openai:
      api-key: ${ALIYUN-AK}
      embedding:
        options:
          model: text-embedding-v3

阿里云百炼平台支持的向量模型:

图片

代码实现

Redis 添加向量数据

@Autowired
private VectorStore vectorStore;

// 构建数据
List documents =
List.of(new Document("I like Spring Boot"),
        new Document("I love Java"));
// 添加到向量数据库
vectorStore.add(documents);

当然,向量数据的数据源可以是文件、图片、音频等资源,这里为了简单演示整体执行流程,使用了更简单直观的文本作为数据源。

VectorStore 提供的常用方法如下:

  • add(Listdocuments):添加文档。
  • delete(ListidList):按 ID 删除文档。
  • delete(Filter.Expression filterExpression):按过滤表达式删除文档。
  • similaritySearch(String query) 和 similaritySearch(SearchRequest request):相似性搜索。

执行结果如下:

图片

查询向量数据

@RestController
@RequestMapping("/vector")
public class VectorController {

    @Resource
    private VectorStore vectorStore;

    @RequestMapping("/find")
    public List find(@RequestParam String query) {
        // 构建搜索请求,设置查询文本和返回的文档数量
        SearchRequest request = SearchRequest.builder()
        .query(query)
        .topK(3)
        .build();
        List result = vectorStore.similaritySearch(request);
        System.out.println(result);
        return result;
    }
}

执行结果如下:

图片

从上述结果可以看出,和“java”相似度最高的向量为“I love Java”,相似度评分为 0.77,如果我们 SearchRequest 对象中的 topK 设置为 1 的话,只会查询“I love Java”这条数据,如下图所示:

图片


本文地址:https://www.yitenyun.com/126.html

搜索文章

Tags

Deepseek 宝塔面板 Linux宝塔 Docker JumpServer JumpServer安装 堡垒机安装 Linux安装JumpServer Windows Windows server net3.5 .NET 安装出错 宝塔面板打不开 宝塔面板无法访问 esxi esxi6 root密码不对 无法登录 web无法登录 Windows宝塔 Mysql重置密码 SSL 堡垒机 跳板机 HTTPS 无法访问宝塔面板 HTTPS加密 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 修改DNS Centos7如何修改DNS scp Linux的scp怎么用 scp上传 scp下载 scp命令 Serverless 无服务器 语言 工具 sqlmock SQL 防火墙 服务器 黑客 网络架构 网络配置 IT运维 MySQL B+Tree ID 字段 InnoDB LRU 数据库 Oracle 处理机制 Linux 安全 List 类型 Redis 速度 服务器中毒 Rsync 聚簇 非聚簇 索引 频繁 Codis mini-redis INCR指令 Web 应用 异步数据库 FastAPI MongoDB 数据结构 悲观锁 乐观锁 StarRocks 开源 数据仓库 openHalo OB 单机版 对象 Doris SeaTunnel 数据集成工具 AI 助手 RocketMQ 长轮询 配置 数据库锁 监控 HexHub SQLite Redka SQLite-Web 数据库管理工具 IT MVCC 事务隔离 Caffeine CP Spring 动态查询 Python Web 序列 核心机制 同城 双活 数据备份 缓存 分布式架构 分布式锁​ MySQL 9.3 架构 部署 开发 API 双引擎 优化 响应模型 sftp 服务器 参数 PostgreSQL 存储引擎 QPS 高并发 缓存方案 缓存架构 缓存穿透 虚拟服务器 虚拟机 内存 SpringAI Milvus 向量数据库 万能公式 原子性 云原生 线上 库存 预扣 Entity Netstat Linux 服务器 端口 Testcloud 云端自动化 数据 业务 Ftp prometheus Alert 单线程 线程 不宕机 分库 分表 Calcite 电商系统 信息化 智能运维 dbt 数据转换工具 容器