DeepSeek重构AI硬件生态:降成本、提效率,剑指十万亿美元产业与AGI
DeepSeek动作频频,目标指向十万亿美元产业
DeepSeek正用开源、降价和底层架构创新,重画AI硬件生态的成本曲线,将目标瞄准十万亿美元产业与AGI。近期,DeepSeek动作不断。5月22日,彭博社爆出其正在推进700亿元人民币的融资,投前估值高达450亿美元。同一天,DeepSeek官宣V4 - Pro API永久降价75%,把促销价直接定为正价。一边向投资人要钱,一边向开发者让利,这一操作令人费解。那么,DeepSeek到底靠什么赚钱,而且要赚很多钱呢?毕竟,AGI不是能口头上说说就能实现的。这正是x博主@bookwormengr研究的问题。
大胆判断:参与塑造万亿美元级AI硬件生态
@bookwormengr在长文《DeepSeek's 10 trillion USD grand strategy》中提出大胆判断:DeepSeek真正的目标可能不是卖编程套餐或语音助手,而是参与塑造一个价值10万亿美元级别的AI硬件生态,并冲击万亿美元级估值。仔细阅读这篇万字长文会发现,梁文锋不是疯子,而是高手,他在下一盘价值10万亿美元的棋。
英雄之旅:一场反共识的技术长征
回顾DeepSeek的成长轨迹,用「英雄之旅」形容毫不为过。当所有人都在堆Dense模型、比拼参数量时,DeepSeek选择啃最难训的MoE(混合专家模型),用更少的计算量实现更高的智能。别人用PPO做强化学习,他们从第一性原理出发,发明了更便宜的GRPO算法。别人还在讨论RLHF的天花板,他们已经跑通了RLVR(基于可验证奖励的强化学习),提升了推理能力。MLA、DSA(解耦稀疏注意力)、mHC(流形约束超连接)、CSA和HCA等技术,都在解决同一个问题:如何在有限的硬件条件下,榨出最大的AI算力。DeepSeek的宿命并非卖API套餐。
一道有趣的数学题:KV Cache的秘密
从具体数字看,打开kvcache.ai的在线计算器,输入100万token上下文、8bit KV精度、16bit索引精度,会得到惊人对比:DeepSeek V4仅需5.48GB HBM,而其他顶级开源模型动辄需要60GB HBM。要知道,DeepSeek V4是1.6万亿参数的模型,体量远大于其他开源模型,但KV Cache占用却只有它们的零头。这使得DeepSeek能把缓存命中的价格定得极低——V4 - Pro缓存命中价仅0.025元/百万Token,不到Claude Sonnet 4.6同类价格的3%,且可持续缓存数小时。永久降价后,输入缓存未命中3元/百万Token,输出6元/百万Token,均为原价的四分之一。梁文锋两年前就说过DeepSeek的定价哲学:不贴钱,也不赚取暴利。如今看来,他所言非虚,因为其KV Cache只有别人的十分之一,成本自然也低。但更深层次的问题是:这个红利流向了哪里?
十万亿美元的棋盘:硬件生态的重构
答案藏在SSD、LPDDR、HBM三个缩写里。第一层,SSD与NAND闪存。KV Cache被压缩到极小后,可高效卸载到SSD上,需要时再快速加载回HBM。DeepSeek在Dual Path论文中还优化了从SSD加载KV Cache的速度,减少了对昂贵HBM的依赖。DeepSeek每压缩一分KV Cache,就为NAND和SSD创造一个庞大的新市场。第二层,LPDDR内存。SGLang团队研究表明,LPDDR可作为「权重暂存区」,模型权重先放在LPDDR里,需要时再流式传输到HBM中,缓解HBM的容量压力。DeepSeek的MoE架构天然适配这个方案,流式加载高效。国产LPDDR在速度和密度上与国际水平差距逐渐缩小。第三层,GPU/ASIC的减压。Engram模块用LPDDR中的哈希查表替代Transformer的前向传播计算,用低成本的「内存读取」替代高成本的「GPU运算」,这对中国AI芯片意义重大。由于EUV光刻机受限,国产GPU在原始FLOPs上落后,但用便宜内存替代昂贵算力,实现「换道超车」变得合理。再加上TileLang——DeepSeek投资的跨硬件内核编译框架,可让一套计算代码同时跑在多种硬件平台上,绕过「CUDA护城河」,国产芯片厂商有望获得生态层面的突破。DeepSeek的技术创新都指向同一个方向:降低对顶级硬件的依赖,让中国现有的存储、芯片、网络生态变得足够用甚至好用。@bookwormengr计算得出,全球AI相关股票的总市值早已远超10万亿美元。如果DeepSeek能帮助中国构建一个等量级的AI硬件生态,它获得1万亿美元的估值是合乎逻辑的。
不赚快钱的逻辑
回顾DeepSeek的「不做」——不做多模态(V4.1才开始试水图像和音频)、不做语音模型、不做视频模型、API一降再降,就不难理解。这不是「不会赚钱」,而是「暂时不屑于赚这种钱」。@bookwormengr提出类比:OpenAI拿到AMD和Cerebras的股权认购权证,用承诺换股权。DeepSeek可以复制这个模式,只不过面对的是整条国产AI硬件产业链。梁文锋是量化基金出身,被称为「Jim Simmon的忠实粉丝」,他不可能不懂资本运作。事实上,融资消息传出前,他已在2026年4月完成关键的股权调整,通过直接与间接持股控制公司约84.29%的股权,表决权100%。宁德时代、京东、网易、国家大基金等投资者入局,他们看到的不是卖API的小生意,而是可能重塑全球AI硬件格局的战略支点。
终极使命:大规模强化学习与AGI
如果认为DeepSeek的终点是「做中国AI硬件生态的发动机」,可能低估了梁文锋。据彭博社报道,梁文锋在投资者会议上明确表示,DeepSeek的主要目标是推动技术边界,追求AGI。硬件生态是手段,AGI才是目的。逻辑在于,当更多硬件可用、算力需求被技术创新压低,DeepSeek就能以更低成本启动更大规模的训练,特别是强化学习(RL)后训练和递归自我改进(RSI)。大规模RL需要生成海量推理轨迹,计算成本极高,100万上下文的长程任务要求轨迹足够长,没有极致的硬件效率优化,这种训练无法进行。RSI更具挑战性,让AI自我设计、执行、分析和改进,对算力需求巨大。但如果DeepSeek通过重构硬件生态降低算力成本,这条路就可行。从MoE到MLA,从DSA到CSA,从Engram到TileLang,从KV Cache压缩到LPDDR流式加载,所有创新都指向同一个终点:让AGI的训练从「烧不起」变成「烧得起」。梁文锋与DeepSeek的星辰大海,不是海面上的浪花,而是洋流本身。
