当前位置: 首页 > news >正文

英伟达RTX Spark登场,端侧AI能否打破现状?

【Wintel联盟受挑战】

有朋友询问如何看待英伟达和微软一起做ARM架构的AI PC。这确实是个值得探讨的问题,芯片参数容易获取,真正有趣的是有人在拆解一个存在40年的联盟。PC行业有个老词“Wintel”,即Windows加Intel,一个提供操作系统,一个提供CPU,锁定了全球几十亿台电脑的底层架构。40年来,购买Windows电脑,CPU不是英特尔就是AMD,均为x86架构,别无选择。这个联盟遭受了两刀。第一刀,2020年苹果发布M1,将英特尔踢出Mac,自行制造CPU并配备系统,效果良好,但苹果仅关注自身领域,macOS与Windows毫无关联。第二刀,2024年高通推出骁龙X Elite,打造Windows on ARM笔记本。Canalys数据显示,2024年Q3,骁龙X出货72万台,市场份额0.8%。其未成功的核心原因是软件生态,微软拖延ARM版Windows 11官方安装包的发布,大量应用需转译,反作弊软件和企业驱动也未解决,高通有芯片却无生态,难以撼动Wintel的地位。

【RTX Spark引发变革】

6月1日,黄仁勋在台北Computex发布RTX Spark,英伟达、微软、ARM同时宣布“ A new era of PC”。与高通不同,高通推出骁龙X时,微软仅表示“支持”,发布几台Surface,推出Copilot+PC概念,Windows对ARM的适配仍在拖延。而此次微软较为主动,在Build 2026大会上,纳德拉将Windows重新定义为本地AI Agent的运行平台,发布Aion 1.0本地模型、Windows Local AI运行时、Project Solara,首次将端侧AI视为重要事务并投入筹码。此前苹果的变革局限于自身,高通未能成功,而此次造芯片和造锁的坐到一起,锁也换成了RTX Spark。黄仁勋称其为“超级芯片(Superchip)”,并非营销话术,从架构来看所言非虚。

【RTX Spark的优势】

过去两年,PC行业一直提及AI PC,通常是在x86处理器旁添加NPU运行轻量AI任务。微软为Copilot+PC设定的NPU算力门槛为40 TOPS,此算力仅能进行语音转文字、图像识别和基础文本补全,无法在本地运行百亿参数的大语言模型。RTX Spark思路不同,它拥有700亿个晶体管,采用台积电3nm工艺,将20核的Grace CPU和一颗Blackwell架构GPU封装在同一芯片上,通过NVLink - C2C连接,带宽达600GB/s。GPU有6144个CUDA核心,AI算力1 petaflop FP4,约为之前NPU的25倍,GPU性能相当于笔记本版的RTX 5070,且与CPU集成。内存方面,传统笔记本CPU和GPU各有独立内存,而RTX Spark采用统一内存架构,最高128GB,CPU和GPU共享,加载大模型时无需在两者间搬运数据。这种架构与苹果M系列类似,RTX Spark首次在Windows阵营复刻该思路,并提升了GPU规模。其前身是英伟达年初发布的桌面AI工作站DGX Spark,定价3999美元,RTX Spark是其笔记本版。OEM已做好准备,微软Surface Laptop Ultra带头,戴尔、惠普、联想、华硕、MSI等跟进,今年秋天上市,RTX Spark将AI引擎置于核心位置。

【市场前景存疑】

芯片虽好,但市场需求存疑。郭明錤在RTX Spark发布前分析,搭载该芯片的设备未来两年出货量约1000万台,在全球PC市场中占比2%,属于小众市场,主要针对对端侧AI算力有需求的重度用户。目前PC上的AI应用核心在云端,如使用ChatGPT、Claude、Gemini等,电脑仅作为浏览器,芯片对其影响不大。郭明錤举例,2026年热门的MacBook Neo,消费者关注的是低价、设计和生态,与端侧AI算力无关;Mac mini等小主机虽受开发者关注,但AI Agent的推理算力主要来自云端,本地仅负责保持在线和调度任务。这表明端侧AI目前缺乏杀手级应用,并非硬件不足,RTX Spark算力足以在本地运行百亿参数模型,但用户缺乏在本地运行的理由。

【微软的努力与现状】

微软并非未意识到问题,Build 2026上发布的内容旨在解决操作系统如何让端侧AI更有用的问题。Aion 1.0是140亿参数的本地小模型,支持工具调用,内置在Windows中,可使Windows上的AI Agent部分推理和决策在本地完成。方向正确,但尚处起步阶段。端侧AI具有隐私数据不出本机、跨应用数据调度不经过第三方服务器、低延迟实时响应等优势,需要操作系统深度整合,并非安装App就能解决。目前的局面是芯片已准备好,操作系统刚起步,用户需求仍停留在使用浏览器访问ChatGPT阶段,三者处于不同时间线,芯片发展最快,生态最慢。

【英伟达的动机】

英伟达推出RTX Spark并非为抢夺英特尔的CPU份额,PC市场规模虽大,但英伟达数据中心业务上季度营收达752亿美元,PC市场的利润对其吸引力不大。英伟达的目标是将CUDA引入笔记本。今年3月GTC大会上,英伟达纪念CUDA二十周年,公布有600万开发者使用CUDA编写代码,运行在英伟达GPU上,覆盖AI训练、推理、科学计算、图形渲染、视频生产等领域,整个AI产业软件栈底层是CUDA,其护城河是迁移成本。目前这600万开发者主要在数据中心使用昂贵芯片,RTX Spark可使他们的代码无需修改和重新编译,直接在笔记本上运行。黄仁勋宣布RTX Spark之后的第二代、第三代芯片已在规划,未来英伟达每代平台架构都将包含Spark芯片,30多款笔记本、10多款台式机将同时上市。不过,CUDA能否普及取决于价格,全球DRAM供应紧张,内存价格上涨,笔记本版首批产品起步价不会低,要让CUDA覆盖更多用户,需要更多代产品以及制程和内存成本的下降。英伟达此时布局,是因为看到微软重视端侧AI、ARM架构在Windows上有OEM支持、CUDA开发者基数足够大的机会。

http://www.zskr.cn/news/1457581.html

相关文章:

  • STM32在线升级时中断卡死?手把手教你用RAM运行中断函数(F0/F1通用)
  • Capstone:多架构支持的终极反汇编器,2025 - 2026 年多版本更新亮点多!
  • 智能运维不是加AI,而是重写SLO——基于172个真实SLI指标的AI驱动根因分析框架(附可审计的因果图谱生成代码)
  • 算法:最大子数组和
  • 避开这些坑,你的Nature Communications投稿就成功了一半:从格式到图表的保姆级自查清单
  • 2026年,成都口腔GEO优化秘诀大揭秘!
  • AI工具如何让拼团转化率飙升37.6%?揭秘3家独角兽私藏的智能分群与动态组队算法
  • 2026年近期河北不锈钢膨胀螺栓直销厂家有哪些?深度解析与安玖不锈钢选型指南 - 2026年企业资讯
  • 为什么老DBA都选“仅安装软件”?Oracle 11g安装模式深度解析与最佳实践
  • BQ4050电池管理芯片SMBus通信全解析:从数据手册到代码实现(附ATmega4809例程)
  • 如何快速使用TestDisk与PhotoRec:数据恢复完整教程
  • ESP8266 AP模式配置避坑指南:从IP地址冲突到稳定局域网搭建
  • HarmonyOS 6.1 云应用客户端适配实战(一):环境搭建与编译系统
  • 从‘能通’到‘好用’:给你的Coturn服务器做一次性能调优与安全加固指南
  • 2026年当前,选择靠谱驾驶式洗地机源头厂家的核心逻辑与价值分析 - 2026年企业资讯
  • 别再乱设max-http-header-size了!从Tomcat、Go到Node.js,聊聊不同技术栈的HTTP头大小默认值与最佳实践
  • 铁路信号工必看:64D半自动闭塞设备按钮、表示灯、继电器功能详解(附工程提示)
  • BMS均衡控制开发套件:主控板Gerber+上位机PCB图+充放电接口定义+可运行源码
  • 2026年6月应急叫应终端供应商推荐口碑分析,点对点卫星通信设备/背包便携站设备/点对点卫星通信,应急叫应终端厂家选哪家 - 品牌推荐师
  • 别再写`status != ‘‘`了!MyBatis中Integer=0被当成空字符串的诡异问题排查与最佳实践
  • Claude 4.8 深度实测:编程能力暴涨,真正拉开差距的却是这一点
  • EduCoder平台金币机制与自动化策略:如何用多个账号‘可持续’获取实训参考答案
  • LLM微调技术在Oracle到PostgreSQL数据库迁移中的应用
  • 告别通信故障:手把手调试施耐德LXM32伺服与西门子PLC的Profibus-DP网络
  • 别再写重复的SQL了!MyBatis-Plus UpdateWrapper和LambdaUpdateWrapper实战对比(附避坑点)
  • Abaqus工程师常用四工具包:cohesive单元自动插入、裂缝路径提取、混凝土骨料建模与CDP参数快速配置
  • 如何在5分钟内实现专业级直播背景替换:OBS背景移除插件终极指南
  • CFD驱动训练框架:湍流建模的高效优化方法
  • 给无人机爱好者的地物识别指南:如何通过多光谱镜头一眼分辨庄稼、旱地和水塘?
  • 别再只画波形图了!用Python和MATLAB提取信号特征的保姆级对比教程