当前位置：首页 > news >正文

DeepSeek重构AI硬件生态：降成本、提效率，剑指十万亿美元产业与AGI

news 2026/5/25 10:12:53

DeepSeek动作频频，目标指向十万亿美元产业

DeepSeek正用开源、降价和底层架构创新，重画AI硬件生态的成本曲线，将目标瞄准十万亿美元产业与AGI。近期，DeepSeek动作不断。5月22日，彭博社爆出其正在推进700亿元人民币的融资，投前估值高达450亿美元。同一天，DeepSeek官宣V4 - Pro API永久降价75%，把促销价直接定为正价。一边向投资人要钱，一边向开发者让利，这一操作令人费解。那么，DeepSeek到底靠什么赚钱，而且要赚很多钱呢？毕竟，AGI不是能口头上说说就能实现的。这正是x博主@bookwormengr研究的问题。

大胆判断：参与塑造万亿美元级AI硬件生态

@bookwormengr在长文《DeepSeek's 10 trillion USD grand strategy》中提出大胆判断：DeepSeek真正的目标可能不是卖编程套餐或语音助手，而是参与塑造一个价值10万亿美元级别的AI硬件生态，并冲击万亿美元级估值。仔细阅读这篇万字长文会发现，梁文锋不是疯子，而是高手，他在下一盘价值10万亿美元的棋。

英雄之旅：一场反共识的技术长征

回顾DeepSeek的成长轨迹，用「英雄之旅」形容毫不为过。当所有人都在堆Dense模型、比拼参数量时，DeepSeek选择啃最难训的MoE（混合专家模型），用更少的计算量实现更高的智能。别人用PPO做强化学习，他们从第一性原理出发，发明了更便宜的GRPO算法。别人还在讨论RLHF的天花板，他们已经跑通了RLVR（基于可验证奖励的强化学习），提升了推理能力。MLA、DSA（解耦稀疏注意力）、mHC（流形约束超连接）、CSA和HCA等技术，都在解决同一个问题：如何在有限的硬件条件下，榨出最大的AI算力。DeepSeek的宿命并非卖API套餐。

一道有趣的数学题：KV Cache的秘密

从具体数字看，打开kvcache.ai的在线计算器，输入100万token上下文、8bit KV精度、16bit索引精度，会得到惊人对比：DeepSeek V4仅需5.48GB HBM，而其他顶级开源模型动辄需要60GB HBM。要知道，DeepSeek V4是1.6万亿参数的模型，体量远大于其他开源模型，但KV Cache占用却只有它们的零头。这使得DeepSeek能把缓存命中的价格定得极低——V4 - Pro缓存命中价仅0.025元/百万Token，不到Claude Sonnet 4.6同类价格的3%，且可持续缓存数小时。永久降价后，输入缓存未命中3元/百万Token，输出6元/百万Token，均为原价的四分之一。梁文锋两年前就说过DeepSeek的定价哲学：不贴钱，也不赚取暴利。如今看来，他所言非虚，因为其KV Cache只有别人的十分之一，成本自然也低。但更深层次的问题是：这个红利流向了哪里？

十万亿美元的棋盘：硬件生态的重构

答案藏在SSD、LPDDR、HBM三个缩写里。第一层，SSD与NAND闪存。KV Cache被压缩到极小后，可高效卸载到SSD上，需要时再快速加载回HBM。DeepSeek在Dual Path论文中还优化了从SSD加载KV Cache的速度，减少了对昂贵HBM的依赖。DeepSeek每压缩一分KV Cache，就为NAND和SSD创造一个庞大的新市场。第二层，LPDDR内存。SGLang团队研究表明，LPDDR可作为「权重暂存区」，模型权重先放在LPDDR里，需要时再流式传输到HBM中，缓解HBM的容量压力。DeepSeek的MoE架构天然适配这个方案，流式加载高效。国产LPDDR在速度和密度上与国际水平差距逐渐缩小。第三层，GPU/ASIC的减压。Engram模块用LPDDR中的哈希查表替代Transformer的前向传播计算，用低成本的「内存读取」替代高成本的「GPU运算」，这对中国AI芯片意义重大。由于EUV光刻机受限，国产GPU在原始FLOPs上落后，但用便宜内存替代昂贵算力，实现「换道超车」变得合理。再加上TileLang——DeepSeek投资的跨硬件内核编译框架，可让一套计算代码同时跑在多种硬件平台上，绕过「CUDA护城河」，国产芯片厂商有望获得生态层面的突破。DeepSeek的技术创新都指向同一个方向：降低对顶级硬件的依赖，让中国现有的存储、芯片、网络生态变得足够用甚至好用。@bookwormengr计算得出，全球AI相关股票的总市值早已远超10万亿美元。如果DeepSeek能帮助中国构建一个等量级的AI硬件生态，它获得1万亿美元的估值是合乎逻辑的。

不赚快钱的逻辑

回顾DeepSeek的「不做」——不做多模态（V4.1才开始试水图像和音频）、不做语音模型、不做视频模型、API一降再降，就不难理解。这不是「不会赚钱」，而是「暂时不屑于赚这种钱」。@bookwormengr提出类比：OpenAI拿到AMD和Cerebras的股权认购权证，用承诺换股权。DeepSeek可以复制这个模式，只不过面对的是整条国产AI硬件产业链。梁文锋是量化基金出身，被称为「Jim Simmon的忠实粉丝」，他不可能不懂资本运作。事实上，融资消息传出前，他已在2026年4月完成关键的股权调整，通过直接与间接持股控制公司约84.29%的股权，表决权100%。宁德时代、京东、网易、国家大基金等投资者入局，他们看到的不是卖API的小生意，而是可能重塑全球AI硬件格局的战略支点。

终极使命：大规模强化学习与AGI

如果认为DeepSeek的终点是「做中国AI硬件生态的发动机」，可能低估了梁文锋。据彭博社报道，梁文锋在投资者会议上明确表示，DeepSeek的主要目标是推动技术边界，追求AGI。硬件生态是手段，AGI才是目的。逻辑在于，当更多硬件可用、算力需求被技术创新压低，DeepSeek就能以更低成本启动更大规模的训练，特别是强化学习（RL）后训练和递归自我改进（RSI）。大规模RL需要生成海量推理轨迹，计算成本极高，100万上下文的长程任务要求轨迹足够长，没有极致的硬件效率优化，这种训练无法进行。RSI更具挑战性，让AI自我设计、执行、分析和改进，对算力需求巨大。但如果DeepSeek通过重构硬件生态降低算力成本，这条路就可行。从MoE到MLA，从DSA到CSA，从Engram到TileLang，从KV Cache压缩到LPDDR流式加载，所有创新都指向同一个终点：让AGI的训练从「烧不起」变成「烧得起」。梁文锋与DeepSeek的星辰大海，不是海面上的浪花，而是洋流本身。

查看全文

http://www.zskr.cn/news/1377289.html