当前位置：首页 > news >正文

英伟达RTX Spark登场，端侧AI能否打破现状？

news 2026/6/4 3:07:00

【Wintel联盟受挑战】

有朋友询问如何看待英伟达和微软一起做ARM架构的AI PC。这确实是个值得探讨的问题，芯片参数容易获取，真正有趣的是有人在拆解一个存在40年的联盟。PC行业有个老词“Wintel”，即Windows加Intel，一个提供操作系统，一个提供CPU，锁定了全球几十亿台电脑的底层架构。40年来，购买Windows电脑，CPU不是英特尔就是AMD，均为x86架构，别无选择。这个联盟遭受了两刀。第一刀，2020年苹果发布M1，将英特尔踢出Mac，自行制造CPU并配备系统，效果良好，但苹果仅关注自身领域，macOS与Windows毫无关联。第二刀，2024年高通推出骁龙X Elite，打造Windows on ARM笔记本。Canalys数据显示，2024年Q3，骁龙X出货72万台，市场份额0.8%。其未成功的核心原因是软件生态，微软拖延ARM版Windows 11官方安装包的发布，大量应用需转译，反作弊软件和企业驱动也未解决，高通有芯片却无生态，难以撼动Wintel的地位。

【RTX Spark引发变革】

6月1日，黄仁勋在台北Computex发布RTX Spark，英伟达、微软、ARM同时宣布“ A new era of PC”。与高通不同，高通推出骁龙X时，微软仅表示“支持”，发布几台Surface，推出Copilot+PC概念，Windows对ARM的适配仍在拖延。而此次微软较为主动，在Build 2026大会上，纳德拉将Windows重新定义为本地AI Agent的运行平台，发布Aion 1.0本地模型、Windows Local AI运行时、Project Solara，首次将端侧AI视为重要事务并投入筹码。此前苹果的变革局限于自身，高通未能成功，而此次造芯片和造锁的坐到一起，锁也换成了RTX Spark。黄仁勋称其为“超级芯片（Superchip）”，并非营销话术，从架构来看所言非虚。

【RTX Spark的优势】

过去两年，PC行业一直提及AI PC，通常是在x86处理器旁添加NPU运行轻量AI任务。微软为Copilot+PC设定的NPU算力门槛为40 TOPS，此算力仅能进行语音转文字、图像识别和基础文本补全，无法在本地运行百亿参数的大语言模型。RTX Spark思路不同，它拥有700亿个晶体管，采用台积电3nm工艺，将20核的Grace CPU和一颗Blackwell架构GPU封装在同一芯片上，通过NVLink - C2C连接，带宽达600GB/s。GPU有6144个CUDA核心，AI算力1 petaflop FP4，约为之前NPU的25倍，GPU性能相当于笔记本版的RTX 5070，且与CPU集成。内存方面，传统笔记本CPU和GPU各有独立内存，而RTX Spark采用统一内存架构，最高128GB，CPU和GPU共享，加载大模型时无需在两者间搬运数据。这种架构与苹果M系列类似，RTX Spark首次在Windows阵营复刻该思路，并提升了GPU规模。其前身是英伟达年初发布的桌面AI工作站DGX Spark，定价3999美元，RTX Spark是其笔记本版。OEM已做好准备，微软Surface Laptop Ultra带头，戴尔、惠普、联想、华硕、MSI等跟进，今年秋天上市，RTX Spark将AI引擎置于核心位置。

【市场前景存疑】

芯片虽好，但市场需求存疑。郭明錤在RTX Spark发布前分析，搭载该芯片的设备未来两年出货量约1000万台，在全球PC市场中占比2%，属于小众市场，主要针对对端侧AI算力有需求的重度用户。目前PC上的AI应用核心在云端，如使用ChatGPT、Claude、Gemini等，电脑仅作为浏览器，芯片对其影响不大。郭明錤举例，2026年热门的MacBook Neo，消费者关注的是低价、设计和生态，与端侧AI算力无关；Mac mini等小主机虽受开发者关注，但AI Agent的推理算力主要来自云端，本地仅负责保持在线和调度任务。这表明端侧AI目前缺乏杀手级应用，并非硬件不足，RTX Spark算力足以在本地运行百亿参数模型，但用户缺乏在本地运行的理由。

【微软的努力与现状】

微软并非未意识到问题，Build 2026上发布的内容旨在解决操作系统如何让端侧AI更有用的问题。Aion 1.0是140亿参数的本地小模型，支持工具调用，内置在Windows中，可使Windows上的AI Agent部分推理和决策在本地完成。方向正确，但尚处起步阶段。端侧AI具有隐私数据不出本机、跨应用数据调度不经过第三方服务器、低延迟实时响应等优势，需要操作系统深度整合，并非安装App就能解决。目前的局面是芯片已准备好，操作系统刚起步，用户需求仍停留在使用浏览器访问ChatGPT阶段，三者处于不同时间线，芯片发展最快，生态最慢。

【英伟达的动机】

英伟达推出RTX Spark并非为抢夺英特尔的CPU份额，PC市场规模虽大，但英伟达数据中心业务上季度营收达752亿美元，PC市场的利润对其吸引力不大。英伟达的目标是将CUDA引入笔记本。今年3月GTC大会上，英伟达纪念CUDA二十周年，公布有600万开发者使用CUDA编写代码，运行在英伟达GPU上，覆盖AI训练、推理、科学计算、图形渲染、视频生产等领域，整个AI产业软件栈底层是CUDA，其护城河是迁移成本。目前这600万开发者主要在数据中心使用昂贵芯片，RTX Spark可使他们的代码无需修改和重新编译，直接在笔记本上运行。黄仁勋宣布RTX Spark之后的第二代、第三代芯片已在规划，未来英伟达每代平台架构都将包含Spark芯片，30多款笔记本、10多款台式机将同时上市。不过，CUDA能否普及取决于价格，全球DRAM供应紧张，内存价格上涨，笔记本版首批产品起步价不会低，要让CUDA覆盖更多用户，需要更多代产品以及制程和内存成本的下降。英伟达此时布局，是因为看到微软重视端侧AI、ARM架构在Windows上有OEM支持、CUDA开发者基数足够大的机会。

查看全文

http://www.zskr.cn/news/1457581.html