当前位置: 首页 > news >正文

Spring AI 2.x 发布:全面拥抱 Java 21,Redis 史诗级增强!

Spring AI 团队刚刚发布了Spring AI 2.0.0-M1。这不仅是一次常规的版本迭代,更是 2.x 系列的正式开篇:技术栈、基线版本、模型生态几乎经历了一轮“大换血”。

在此之前,Spring AI 1.1 正式版于上月发布,带来了 MCP 开箱即用、Prompt 缓存、自进化智能体等特性。

本次里程碑版本基于Spring Boot 4.0 GASpring Framework 7.0构建,以Jakarta EE 11为基石,并强制要求 Java 21作为最低开发环境。

整体来看,Spring AI 2.0.0-M1 一共合入了67 项改动,包括:

  • 25 项功能增强:围绕 AI 原生开发体验做了大幅扩展;
  • 32 项文档更新:对新手更友好,踩坑前多看一眼能省不少时间;
  • 7 个稳定性修复 + 3 个安全依赖升级:把基础打得更稳。

下面按模块简单拆一下这次版本的几个关键变化。

底层架构全面跟进:Spring Boot 4 & Framework 7

这是 Spring AI 2.0 最根本的变化。Spring AI 已经从 Spring Boot 3.x 全面迁到Spring Boot 4.0 GA/Spring Framework 7.0

这意味着:

  • 红利:你可以直接享受到新一代框架在虚拟线程AOT 编译性能调优等方面的所有新特性。
  • 成本:必须将运行环境升级到Java 21。对于老项目而言,这是迁移前需要重点评估的成本。

对应的 issue 地址:https://github.com/spring-projects/spring-ai/pull/4774

Spring Boot 4.0 的新特性我也发文章详细介绍过:Spring Boot 4.0 正式发布,人已麻。。。

Redis 生态深化:记忆能力 + 检索能力双升级

Redis 在本次更新中获得了史诗级的增强,成为构建企业级 AI 应用的首选存储方案之一。

1.Redis Chat Memory 全新实现

新增了基于 Redis 的聊天记忆组件(含 Spring Boot Starter),核心特性包括:

  • 持久化记忆:支持跨会话保留上下文,不再丢失用户历史。
  • 检索增强:支持文本搜索与范围查询。
  • 性能调优:针对向量检索的HNSW 索引参数(M, efConstruction, efRuntime)完全开放配置。这意味着你可以根据业务需求,在“召回率”与“时延”之间做精细平衡。

对应的文档地址: https://docs.spring.io/spring-ai/reference/2.0/api/vectordbs/redis.html

2.Redis Vector Store 升级

向量存储能力同步升级:

  • 新增文本搜索范围查询能力。
  • 同样暴露 HNSW 相关参数,方便进行细粒度的性能权衡。

Maven 依赖:

<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-redis-store</artifactId> <version>2.0.0-M1</version> </dependency>

如果你的技术栈里已经有了 Redis,引入这个依赖可以让你无需额外部署专门的向量数据库(如 Milvus、Chroma)或记忆存储组件,直接利用现有的 Redis 基础设施就能构建生产级的 AI 应用。

模型能力的全面爆发:Claude, OpenAI 与 Gemini

在大模型接入层,这次的更新也相当密集。

  • Anthropic Claude:一口气上到 4.5
    • 新增对Claude 4.5 Opus / Haiku的支持;
    • 引入Citations API:可以在回答中精确标注来源文档的具体片段(PDF、纯文本等),对 RAG、问答类场景非常有用,目前支持 Claude 3.7 Sonnet 和 Claude 4 系列;
    • 集成Files API:模型可以直接生成可下载文件(代码、报告等),更适合做 Agent / 工具型应用;
    • 工具调用能力新增 Auto / Any / Tool / None 四种模式,方便精细控制“模型何时、如何用工具”。
  • OpenAI:官方 Java SDK 原生接入
    • Spring AI 现在直接集成了OpenAI 官方 Java SDK
    • 默认聊天模型也更新为当前前沿的 gpt-5-mini,开箱即用的效果会比老版本好不少。

  • Google Gemini:思考深度可调:Google GenAI SDK 升级到1.30.0,并为 Gemini 模型补上了 ThinkingConfig / ThinkingLevel 配置。简单理解:可以通过配置项来控制“模型想多深”,在推理质量和响应时延之间找到更合适的平衡点。

企业级特性与基础设施扩展

除了模型和存储,这次在基础设施侧也做了几处针对企业场景的补强:

  • Azure Cosmos DB Chat Memory:新增了对应的 Spring Boot Starter,Azure 生态的同学可以直接把聊天记录落在 Cosmos DB 里,少写不少样板代码。
  • Model Context Protocol(MCP)增强:优化了 MCP 客户端的自动配置流程,引入可选的处理器注册表,并改善了对复杂 Bean 类型的支持,让 MCP 能更自然地融入现有 Spring 应用。
  • GemFire 向量存储安全加固:GemFire Vector Store 现在支持用户名 / 密码认证,对有合规要求的企业环境更友好。

总结

下面是Spring AI 2.0.0-M1带来的关键升级:

  1. 基座升级:全面基于Spring Boot 4.0 GASpring Framework 7.0构建,强制要求 Java 21
  2. Redis 史诗级增强:新增 Redis Chat Memory(支持持久化、搜索),向量存储支持文本搜索与 HNSW 参数调优,确立了 Redis 在 Spring AI 生态中 RAG/记忆系统的首选方案之一。
  3. 模型生态爆发
  4. Anthropic:支持 Claude 4.5,新增 Citations API(引用溯源)和 Files API(生成文件)。
  5. OpenAI:集成官方 Java SDK,默认模型更新为 gpt-5-mini。
  6. Google:Gemini 支持思考深度(ThinkingLevel)配置。
  7. 企业级特性:新增 Azure Cosmos DB 聊天记忆,增强 MCP 客户端配置,GemFire 支持安全认证。
http://www.zskr.cn/news/112519.html

相关文章:

  • vscode copilot 不显示 claude sonnet 模型
  • Universal Key Programming: 2025 Autel AT100 Transponder Chip (10pcs/lot) for KM100, IM508, IM608
  • 百川大模型+BGE嵌入+LobeChat组合拳实战
  • 以太网为什么使用基带传输
  • Android系统DMS驾驶纪录之GPS组件追踪服务架构分析
  • 20. 指数函数和对数函数
  • vue3中computed计算属性和watch监听的异同点
  • LobeChat表单插件开发入门:为AI添加结构化输入
  • LobeChat快手内容推送策略
  • 纪念币预约自动化工具使用指南:告别手动抢购的烦恼
  • .NET进阶——深入理解线程(1)同步异步与单线程多线程的区分
  • 基于STM32的智能水质检测鱼缸监测系统设计与实现
  • 基于STM32的水质检测系统设计与实现
  • 幽冥大陆(五十二)V10酒店门锁SDK TypeScript——东方仙盟筑基期
  • 读捍卫隐私08智能出行
  • 如何终极解决Windows依赖管理难题?完整系统依赖修复方案
  • 当时序数据不再“只是时间”:金仓数据库如何在复杂场景中拉开与 InfluxDB 的差距
  • MiniMax+LobeChat打造情感化AI对话体验
  • 【AI】2025 0x401新生交流赛 wp
  • GEE训练教程:利用 Google Earth Engine 分析广州地区植被动态变化(2016-2025)
  • 如何快速批量下载播客节目:终极免费工具完整指南
  • HTML5配合AES加密实现大文件分块传输安全?
  • 00 后只想一句话说清楚,50 后非要一套 OA 流程走完:到底谁在拖谁后腿?
  • 抖音直播永久保存指南:3分钟搞定高清回放下载
  • 移动端AI绘图革命:iPhone秒级生图技术深度解析
  • Android16音频之设置首选设备AudioTrack.setPreferredDevice:用法实例(一百五十五)
  • Debezium报错处理系列之第132篇:currentChangePosition=NULL(NULL)} as its LSN is NULL which is not expected
  • 网页前端如何通过JS实现大文件分块上传的进度条?
  • 互联网大厂Java面试:音视频场景下的技术栈深度解析
  • Android16之交叉编译系统压力测试利器:stress-ng(二百六十六)