当前位置: 首页 > news >正文

英伟达Vera CPU正式交付:单核性能提升50%,Anthropic和OpenAI已率先部署

一、Vera CPU首批交付英伟达的新十亿美元级业务英伟达近日宣布首款面向智能体Agentic AI的专用CPU Vera正式投产交付首批设备已发送至Anthropic、OpenAI、SpaceX AI及甲骨文云等头部AI公司。Vera搭载88颗英伟达自研Olympus核心内存带宽达1.2 TB/s单核性能较上一代x86服务器CPU提升50%。英伟达已将Vera定位为新的数十亿美元级业务。Vera的核心创新在于统一内存架构通过NVLink-C2C与GPU实现芯片级互联数据传输延迟比传统PCIe连接低10倍能效提升2倍。这意味着在Agentic AI场景中Vera可以与Rubin GPU实现无缝协同——CPU负责控制逻辑、状态管理和API编排GPU负责矩阵运算加速两者通过统一内存共享数据避免了跨PCIe的数据搬运开销。Vera的定位不是替代Intel/AMD的通用服务器CPU而是为AI推理场景专门优化的AI Native CPU。在Agentic AI工作负载中约30%的计算任务如LLM推理的键值缓存管理、多Agent的状态同步天然适合CPU执行。Vera通过硬件级优化将这些任务的执行效率提升至传统CPU的2-3倍。二、为什么Anthropic和OpenAI需要VeraAnthropic和OpenAI率先部署Vera背后是Agentic AI对算力架构的根本性重塑。传统LLM推理只需要GPU但Agent系统需要同时运行多个模型实例、记忆管理、外部工具调用、实时反馈——这些任务对CPU的单核性能和内存带宽要求极高传统的霄龙/至强CPU已无法满足需求。以Anthropic的Claude Agent为例一个复杂的Agent任务可能同时调用5-10个外部工具每个工具调用都涉及HTTP请求/响应、状态更新、错误重试等CPU密集型操作。在万级并发的Agent场景下传统CPU成为瓶颈导致GPU利用率不足30%。Vera通过超高内存带宽1.2 TB/s和低延迟互联将Agent调度效率提升至新水平释放GPU算力。SpaceX AI部署Vera则反映了一个不同场景太空算力。SpaceX在星链卫星上部署AI推理芯片需要在功耗和性能之间找到最优平衡。Vera的能效比优势相同性能下功耗降低40%使其成为太空AI推理的首选CPU。三、Vera搅局x86服务器CPU市场格局重塑Vera的交付对Intel和AMD构成直接冲击。Intel Xeon和AMD EPYC长期垄断服务器CPU市场但两者都是通用处理器缺乏针对AI工作负载的专门优化。Vera的出现将加速服务器CPU市场的AI化——未来服务器CPU的选购标准将从核心数×频率转向AI推理吞吐量×能效比。AMD的反应值得关注。苏姿丰在Computex前夕访台有消息称AMD正在加速代号Turin的下一代EPYC处理器的AI优化功能以应对Vera的竞争。Intel则选择强化Gaudi加速器路线通过CPU加速器的组合对抗英伟达的全栈方案。对于国内服务器市场Vera的架构创新同样具有借鉴意义。平头哥含光800阿里自研AI推理芯片与倚天710Arm服务器CPU的组合已在国内云厂商中验证了自研AI CPU自研AI加速器的协同路径。随着Vera在全球市场的示范效应更多国内厂商将探索类似的AI全栈整合方案。
http://www.zskr.cn/news/1399374.html

相关文章:

  • 基于Gemini与Antigravity框架构建AI驱动的智能命令行工具
  • 手把手教你用VNC Viewer远程显示树莓派桌面(附免费软件和SSH+VNC完整配置流程)
  • 2026年知名的贵州室外耐晒磁漆/贵州地坪漆品牌厂家推荐 - 行业平台推荐
  • 基于PLC的高科技房屋安防控制系统(设计源文件+万字报告+讲解)(支持资料、图片参考_降重降ai)_文章底部可以扫码
  • 2026年知名的高效电机/异步电机/防爆电机长期合作厂家推荐 - 品牌宣传支持者
  • 2026年北京会展沙发桌椅租赁/庆典沙发桌椅租赁优质公司推荐 - 品牌宣传支持者
  • 2026年质量好的围墙护栏/草坪护栏多家厂家对比分析 - 品牌宣传支持者
  • AI辅助开发实战:一小时构建完整Web应用
  • 2026年评价高的护栏/厂区护栏/九江桥梁护栏推荐品牌厂家 - 品牌宣传支持者
  • 2026年热门的变频电机/三相电机/YE3高效电机高口碑品牌推荐 - 品牌宣传支持者
  • 大一C语言程序设计期末复习指南
  • AI编程时代密钥安全:从硬编码到环境变量与自动化检测
  • 从A2A到控制平面:构建生产级多智能体系统的架构演进
  • 用Python手把手复现2013年的狼群算法(WPA),搞定你的第一个智能优化项目
  • MCP框架与Playwright/Puppeteer CLI浏览器自动化实战性能对比
  • AI智能体工作流构建实战:从状态机设计到工程实现
  • 基于大语言模型的自然语言转数据库Schema系统设计与实现
  • RAG检索结果不够准?揭秘“双塔+单塔“组合背后的精准秘诀!秒懂工业级RAG架构核心!
  • 基于AssemblyAI与Groq构建语音控制AI智能体:从原理到实践
  • 2026年附近代理记账财税咨询/嘉兴代理记账报税/嘉兴公司注册代理记账精选推荐 - 品牌宣传支持者
  • LangChain生态:框架、运行时与驾驭框架如何协同工作?
  • 英伟达收购SchedMD:AI调度器Slurm控制权转移的技术影响与应对策略
  • ctf show web 入门256
  • 土地利用优化配置的多目标人工免疫优化模型【附程序】
  • 别再死记硬背了!用UE4 DS做联机游戏,搞懂Role和Replicate才是王道
  • 网安副业单日入账 12k,到底是什么私活这么赚钱?
  • 2026年4月大连味之母口碑好吗,大连味之母,大连味之母好不好 - 品牌推荐师
  • 告别数据手册:手把手教你用STM32的SPI驱动GAD7980 ADC(附完整代码)
  • 2026年热门的海口美兰机场租车/海口包年租车/海口租中巴租车/海口东站租车品牌公司推荐 - 行业平台推荐
  • taotoken的api密钥管理与审计日志如何满足企业安全合规需求