当前位置: 首页 > news >正文

DeepSeek砍价75%说永久,我看到了三个更深的信号

DeepSeek砍价75%说永久我看到了三个更深的信号降价75%还说是永久的5月22号晚上DeepSeek发了个公告我看完直接愣了一下。不是小打小闹的打折是永久降价75%。原来2.5折的促销价到期后不再恢复直接变成正式价。也就是说如果你之前觉得6月就要涨价了赶紧用——不用急了这个价格永远就这样了。这不是什么限时优惠这是重新定价。先看数字感受一下力度V4 Pro 新价输入每百万tokens 3元输出6元。缓存命中更是只要0.025元。原价是多少输入12元输出24元。直接砍掉四分之三。V4 Flash更便宜输入1元输出2元。你可能觉得3块钱6块钱也不便宜啊——那我给你个参照同级别的Claude Opus输出每百万tokens大概150元。DeepSeek是它的二十五分之一。不是便宜一点是便宜了一个数量级。为什么降我翻了三个原因官方公告没解释原因只说了降价两个字。但我把最近的新闻串起来看觉得答案其实挺明显的。第一个原因架构效率真的提上去了。V4 Pro用的是Engram架构1.6T总参数49B激活的MoE模型。相比V3.2同等任务只需要27%的token消耗KV cache只有原来的10%。翻译成人话就是同样跑一次V4 Pro花的算力不到V3的三分之一。成本降了价格自然能降。第二个原因昇腾950进来了。这是最近圈内讨论最多的事。有消息说DeepSeek V4已经在华为昇腾950的A3集群上跑通了。8K输入延迟约20msDecode约4700 TPS——这个数据不比英伟达差。为什么重要因为算力不再只靠英伟达了。多了一个供应商议价权就上来了成本空间就出来了。第三个原因生态打法。DeepSeek拿了700亿融资国家大基金领投。它不缺钱缺的是用户量和生态黏性。API价格降到这个程度所有中小开发者、创业公司都会涌过来。这不是在做生意是在圈地。并发限制也调了这是另一只靴子降价的同时DeepSeek还调了并发限制。V4 Flash并发500V4 Pro并发2500。超过就429。看着像降价又限流等于没降不是。官方说得很直白之前有人用API反代大量白嫖算力影响正常用户。限制并发主要是打这帮人的。对正常开发者来说V4 Pro 2500的并发够用了。真正被卡的是那种开反代站薅羊毛的。这件事的深层含义比降价本身更大我琢磨了一下觉得这件事背后有三层信号值得每个人想想。第一层大模型API的定价体系正在崩塌。以前的定价逻辑是模型多大→训练多贵→API就定多贵。但现在架构优化国产算力规模效应把成本结构彻底打穿了。V4 Pro的性能不输GPT-5价格却只有人家几十分之一。这意味着按参数量定价的时代快结束了未来是按实际成本微利来定。第二层算力去英伟达化正在从PPT变成现实。昇腾950跑通V4 ProCANN生态从概念验证到Triton原生兼容——这些变化意味着国产AI算力不再是能用但慢而是能用而且够快。当你的推理不再100%依赖英伟达GPU你的成本就有巨大的下降空间。第三层对普通人来说AI应用要爆发了。API价格降到这个水平意味着开发一个AI应用的后端成本几乎可以忽略不计。以前做一个AI客服、AI写作助手、AI编程工具每个月API费动辄几千几万。现在可能几百块就搞定了。我判断接下来半年到一年会有一波AI应用创业潮。不是因为技术突破而是因为成本终于降到了普通人玩得起的程度。说个我自己的判断我觉得DeepSeek这一步不是在跟OpenAI打价格战。它在做一件更根本的事重新定义AI的计价单位。以前我们说1个token多少钱以后可能说的是1个Agent运行1小时多少钱甚至1个AI应用服务1个用户1个月多少钱。当推理成本无限趋近于零商业模式就不可能还是卖token。谁先想清楚新的计价方式谁就是下一轮的赢家。DeepSeek用75%的降幅告诉你我准备好了你们呢
http://www.zskr.cn/news/1376386.html

相关文章:

  • nanoFramework 正式支持 Raspberry Pi Pico RP2040
  • ESP32四次握手捕获实战:嵌入式Wi-Fi安全调试与协议验证
  • Unity UI适配终极指南:CanvasScaler原理与SafeArea实战
  • SecureLearn:面向传统ML模型的攻击无关数据投毒防御框架
  • 如何轻松搞定OneNote全局搜索替换:OneMore插件让你告别繁琐的手动操作
  • Selenium接管已启动Chrome浏览器实战指南
  • 银河麒麟V4.0.2-sp4服务器上不了网?三步搞定网络、DNS和软件源(附完整命令)
  • 协变量偏移下BART模型的稳健性:教育数据预测的实践与反思
  • Unity 2021 LTS深度实践:C# 9.0兼容性与MonoBehaviour生命周期真相
  • Godot资源提取零基础指南:5分钟获取PNG/OGG/TSCN素材
  • VS Code 提交变 yarn 执行?解析 Git Hook 劫持真相
  • 5分钟解锁QQ音乐加密文件:Mac用户的免费音频转换神器
  • Unity触控开发实战:TouchScript零基础集成与多点手势详解
  • 移动端H5爬虫:绕过APP限制+破解H5接口,数据采集新思路
  • 上海专业净化房安装公司哪家靠谱 本地正规净化工程安装企业甄选指南(2026 年 5 月最新) - GEO排行榜
  • 手机号查QQ号的合规实现:3步构建安全映射体系
  • Ghidra Server部署实战:架构解析与Docker化自动化指南
  • ParsecVDD虚拟显示器驱动技术深度解析:Windows IddCx架构下的性能革命
  • 联邦学习梯度泄露:四种隐私攻击原理与差分隐私防御实践
  • 逆向工程能力成长路线图:Windows内核、安卓安全与游戏协议实战
  • 从感知机到K近邻:机器学习基础算法原理与实践解析
  • NHSE深度解析:动物森友会存档编辑器的进阶实战指南
  • Nodejs后端服务集成Taotoken多模型API的完整配置指南
  • 恶意安全三方计算:基于批量验证与GPU加速的高效隐私机器学习推理
  • 如何用茉莉花插件一键提升Zotero中文文献管理效率90%
  • Kali Web渗透实战:从登录接口到管理员后台的完整链路
  • CVE-2016-2183漏洞深度治理:从SWEET32原理到全栈禁用实战
  • LizzieYzy:基于Java Swing的围棋AI分析引擎架构与实战应用
  • Ubuntu下从编译到运行:Chrono Engine传感器模块完整配置指南(含CUDA/OptiX避坑)
  • Keil中二进制宏定义优化嵌入式寄存器操作