当前位置: 首页 > news >正文

DeepSeek永久降价,这事没你想的那么简单

DeepSeek永久降价了。不是促销不是限时活动是把V4系列模型的API价格直接砍到了地板上。V4-Flash的输入tokencache hit价格降到了0.0028美元每百万tokencache miss也不过0.14美元。更狠的是V4-Pro75%的折扣虽然5月底到期但官方明确说了折扣结束后新定价就是原价的四分之一。坦率的讲我第一次看到这个数字的时候还以为自己看错了。你想想看0.0028美元每百万token的cache hit价格我换个说法你就懂了你用DeepSeek V4-Flash处理100万token的输入cache命中的情况下成本大概不到2分钱人民币。100万token啊朋友们那可是好几本《三体》的内容量。说真的这个价格已经不是「便宜」可以形容的了这基本上是在告诉整个行业AI推理成本的下限远比大家想象的要低。1.一个被忽略的时间节点很多人可能只关注到了价格数字本身但我觉得有个细节特别值得注意。这次价格调整生效的日期是2026年4月26日。而DeepSeek的V4模型是在更早之前发布的。也就是说这不是新模型发布时的定价策略而是对已经在跑的成熟模型做了一次「永久性」的价格下调。我一直觉得一家AI公司愿意在模型已经稳定运行之后主动降价这背后传递的信号比价格本身更重要。它说明两件事。第一DeepSeek的推理成本优化做到了一个新的水平低到他们觉得即使降价也有足够的利润空间。第二他们选择了把这部分利润让给用户而不是自己吃掉。说到底这是一个战略选择。2.V4到底是什么水平可能有朋友对DeepSeek的V4系列还不太熟悉我简单聊两句。目前DeepSeek API上有两个主力模型V4-Flash和V4-Pro。V4-Flash可以理解为「快枪手」适合需要快速响应的场景支持非思考模式和思考模式两种。V4-Pro则是「深度思考者」推理能力更强当然价格也更高。两个模型都支持100万token的上下文长度最大输出384K token。这个参数放到现在依然是行业顶级水平。我自己用DeepSeek的API已经有一段时间了说实话V4-Flash的性价比一直都很离谱。现在价格再砍一刀我甚至有点替其他AI公司担心。3.价格战的真正含义说到这里可能有人会想这不就是一场价格战嘛有什么好大惊小怪的。但我自己的感受是这次跟之前那些价格战不太一样。回顾一下AI行业的定价历史。2024年的时候各家都在比拼「谁更贵」因为贵代表高端、代表能力。到了2025年开始有公司试探性降价但幅度有限更多是一种营销手段。而DeepSeek这次的操作直接把价格锚点定到了一个让人窒息的位置。你想想看如果你是一个AI创业公司你的模型能力跟DeepSeek V4差不多但你的定价是它的5倍甚至10倍你怎么跟客户解释我们更稳定我们服务更好这些理由在巨大的价格差距面前说服力会越来越弱。说真的我觉得这不是一场简单的价格战这是一次关于AI基础设施定价权的重新定义。就像当年云计算刚兴起的时候AWS也是通过一轮又一轮的降价最终把云计算变成了一个「水电煤」一样的基础设施。DeepSeek现在做的事情思路很像。4.开发者的春天回到普通开发者和创业者的视角这个消息意味着什么呢坦率的讲这是一个巨大的利好。我身边有不少做AI应用的朋友他们最头疼的不是技术实现而是成本。调用一次大模型API的费用乘以用户量再乘以使用频次那个数字经常让人头皮发麻。有个做AI写作工具的朋友跟我说过一句话我印象特别深。他说我做的产品用户很喜欢但我不敢推广因为每多一个活跃用户我就多亏一点钱。这种困境在DeepSeek这轮降价之后会得到很大的缓解。特别是那些依赖长上下文处理的应用比如文档分析、代码审查、多轮对话100万token的上下文加上这个价格成本直接降了一个数量级。我一直觉得AI行业真正的爆发不是在模型能力有多强的时候而是在使用成本低到不用想的时候。就像你不会纠结用微信发消息要花多少钱一样当AI推理的成本低到可以忽略那才是真正的拐点。5.行业格局的变化这个事情对行业的影响我觉得会比表面上看到的更深远。首先是中小模型公司的生存空间会被进一步压缩。坦率的讲如果你的模型没有在某个垂直领域有绝对的护城河跟DeepSeek拼价格基本是死路一条。其次是应用层会迎来一波新的创新潮。成本降低了意味着以前因为太贵而不敢做的想法现在可以试试了。你想想看一个AI客服系统以前每次对话成本可能要几毛钱现在降到几分钱甚至更低这个商业模式就完全不一样了。还有一点我觉得特别值得观察。DeepSeek这次降价会不会引发连锁反应其他大模型公司会不会被迫跟进如果大家都开始降价那AI行业可能会加速进入「基础设施化」阶段。到那时候竞争的焦点就不再是「谁的模型更便宜」而是「谁的生态更好用」「谁的工具链更完整」。说真的这个剧本我在云计算行业见过一次了。6.一个值得关注的细节最后说一个很多人可能没注意到的细节。DeepSeek的API文档里把deepseek-chat和deepseek-reasoner标注为了「即将弃用」弃用日期是2026年7月24日。这两个旧模型名会分别对应到V4-Flash的非思考模式和思考模式。这说明什么说明DeepSeek在做一次品牌统一。以后就是V4系列Flash和Pro两条产品线清晰明了。我个人觉得这个操作挺聪明的。品牌越简洁用户认知成本越低推广效率越高。你看OpenAI搞了一堆模型名GPT-4、GPT-4o、GPT-4o-mini、o1、o3普通用户根本分不清谁是谁。DeepSeek就两个Flash和Pro一个快一个强选就完了。这种简洁背后其实也是一种自信。我就不需要那么多花里胡哨的产品线来证明我的能力两个模型够用了。7.写到这你可能会问这次降价跟普通人有什么关系直接关系可能不大毕竟大多数人不会直接调用API。但间接关系很大。你用的AI产品不管是AI写作、AI客服、AI翻译还是AI编程它们背后都依赖大模型API。当API价格降低这些产品的成本就会降低最终会传导到你身上。可能是更低的订阅费可能是更慷慨的免费额度也可能是更多好用的产品涌现。我一直坚信的一件事是AI不应该是一个奢侈品。它应该是像水和电一样的基础设施每个人都能用得起、用得上。DeepSeek这次永久降价是朝着这个方向迈出的又一步。而这个行业的故事才刚刚开始。
http://www.zskr.cn/news/1401414.html

相关文章:

  • Java枚举类的底层实现与高级用法
  • 点云数据处理技术梳理
  • 为Claude Code配置Taotoken密钥与基地址以解决封号困扰
  • PowerBuilder 12.5实战:从零构建企业级应用
  • DBeaver 驱动下载慢 DBeaver 驱动下载失败 DBeaver 镜像加速
  • Vex:免费开源的 .NET + Avalonia 跨平台 Markdown 编辑器
  • 联盛德 HLK-W806 (十二): 深度解析ST7567驱动配置与图形绘制优化
  • 超越HTTP:Nginx Stream模块实战TCP/UDP代理与负载均衡
  • Deep3D:基于深度学习的端到端2D转3D视频实时转换技术解析
  • FModel终极指南:免费探索虚幻引擎游戏资源的完整教程
  • GitHub加速插件:3分钟告别龟速下载,让代码克隆速度提升10倍
  • DrBERT-7GB:革命性法语生物医学AI模型,7GB医学数据预训练完全指南 [特殊字符]
  • Bugku CTF---RSA入门:从反编译到私钥求解
  • AutoCAD字体同步管理解决方案:FontCenter插件技术实现详解
  • 3个实用技巧:如何让课堂学习更高效自主
  • CSMM 软件能力成熟度模型:中国软件企业的自主能力提升路径
  • 小马智行第一季营收2.4亿:Robotaxi收入5910万 预计全年车队规模超3500辆
  • 终极Windows键盘效率神器:Win-Vind完整使用指南
  • 【新手避坑指南】ISE14.7点亮第一个LED:从代码到硬件的完整FPGA开发闭环
  • 终极SQL代码检查指南:如何用sql-lint告别数据库开发中的低级错误
  • AI编程助手配置优化:告别臃肿提示词,拥抱高效上下文工程
  • Chrony时间服务器
  • 微信消息自动转发工具:5分钟实现多群消息同步
  • Coze智能体开发:扣子 AI 编程概述
  • 终极指南:FinancialBERT-Sentiment-Analysis模型深度解析与实战应用
  • openpilot 2025技术展望:从规则驱动到AI原生驾驶系统的范式转变
  • 高性能视频渲染中的临时缓冲区优化技术:MPC Video Renderer 的实践应用
  • 如何快速上手Lemone-Router:5分钟完成法国税法文本分类的完整指南
  • 10个E5-large-en-ru应用场景:从检索到分类的完整解决方案
  • 通过curl命令快速测试Taotoken不同大模型API的响应效果