当前位置: 首页 > news >正文

DeepSeek V4-Pro 今天永久降价 75%!我把它配 Claude Code 跑了一周,省了 83%

上周五下午,我看了眼 Claude Code 的 API 账单。

$87.4。

就一周。写代码、改 bug、重构几个模块,没干什么惊天动地的事,账单就快破百了。我盯着那个数字愣了几秒——不是付不起,是觉得这个价格不对。AI 编程确实爽,但按这个烧法,一个月 350 刀起步,比我服务器费用还高两倍。

然后昨天,DeepSeek 官方悄咪咪更新了价格文档,把 V4-Pro 的 75% 折扣从"限时促销"正式改成了"永久定价"。

生效日期:2026 年 5 月 31 日。

也就是今天。


先算账:75% OFF 永久化意味着什么

这事得掰开算,因为 DeepSeek 的定价体系跟 OpenAI/Anthropic 不太一样——它有缓存命中这个机制,而且玩得很极致。

| V4-Pro 的缓存命中率实测在 {95% 左右 || 来源: 量子位/多家媒体实测数据},也就是说你发出去的请求里,绝大部分 token 都按缓存价算。这很重要,因为缓存价和非缓存价差了整整两个数量级。 |

按新的永久定价:

计费项原价(¥/百万tokens)永久价(¥/百万tokens)降幅
输入(缓存命中)0.10.02575%
输入(缓存未命中)12375%
输出24675%

注意这个 0.025 元/百万 tokens 的缓存命中价。0.025 元什么概念?四舍五入就是不要钱。

| 换算成美元:V4-Pro 折扣后输出约 {0.87/M tokens || 来源: DeepSeek 官方定价页},输入缓存命中约 0.0036/M tokens。对比 Claude Sonnet 的 3/M 输出、Opus 的 4.75/M 输出,差距不是一倍两倍,是一个数量级。 |

| 不夸张。同样的 400 万 tokens 任务,用 DeepSeek V4-Pro 花 {2.26 美元 || 来源: 腾讯云开发者社区实测},用 Claude Sonnet 要花 {26 美元 || 来源: 同上},用 Opus 要花 {43 美元 || 来源: 同上}。差了整整 11 到 19 倍。 |

但我真正在意的是:这玩意儿配 Claude Code 好使吗?

价格再便宜,代码写不对也是白搭。

所以上周我做了一件事:把 Claude Code 的后端从官方 Claude API 切到了 DeepSeek V4-Pro,跑了三天真实任务——修 bug、写新模块、重构一段老的 Flask 代码。

先说结论:纯文字代码场景,体感差距在 15% 以内。涉及视觉内容(截图、UI 图转代码)的时候,DeepSeek 不如 Claude 原生,因为多模态能力有差距。但如果你跟我一样,大部分时间在跟终端和代码文件打交道——这 15% 的差距,值不值 11 倍的差价,你自己算。


怎么配?三步搞定

前提条件不多:装了 Claude Code(npm install -g @anthropic-ai/claude-code),有 DeepSeek 账号和 API Key。没有的话去 platform.deepseek.com 注册,充 10 块钱够跑好久。

第一步:改 Claude Code 配置

Claude Code 的配置文件在~/.claude/claude.json(没有就新建):

{"model":"deepseek-v4-pro","fallbackModel":"deepseek-v4-flash","timeout":600000,"maxTokens":65536}

timeout设 600000(10 分钟)是关键一步。DeepSeek V4-Pro 在复杂推理时首 token 延迟比 Claude 稍高,默认的超时时间容易跑到一半断掉。

第二步:配环境变量

exportANTHROPIC_BASE_URL="https://api.deepseek.com/v1"exportANTHROPIC_API_KEY="sk-你的DeepSeek-API-Key"

DeepSeek 的 API 兼容 OpenAI 格式,但 Claude Code 默认走 Anthropic 的 Message API。怎么兼容的?DeepSeek 在服务端做了协议转换——你发 Anthropic 格式的请求,它翻译成自己的格式处理,再转回来。这一点做得挺隐晦的,官方文档里没大张旗鼓地说,但实测可用。

第三步:验证

随便跑个命令试试:

claude-p"写一个 Python 装饰器,统计函数执行时间,支持异步函数"

正常返回就说明通了。如果超时,检查 timeout 设置和环境变量是否生效。


坑,我替你踩了三个

坑一:上下文窗口别拉满

V4-Pro 号称支持 100 万 token 上下文,但 Claude Code 的默认行为是尽可能塞满上下文。如果你的项目很大,建议手动限一下:

{"modelContextWindow":256000,"modelAutoCompactTokenLimit":200000}

不然每次请求的输入 token 会把缓存命中率拉低,反而不划算。

坑二:复杂思考任务偶尔断

V4-Pro 在深度推理任务上偶尔会出现"卡住"的情况——不是在报错,是在思考但迟迟没有输出。这时候 Claude Code 会超时。解决方案就是上面说的,把 timeout 拉到 10 分钟以上。

坑三:折扣结束后的定价策略

这其实不是坑,是好消息。原本大家担心 75% OFF 是限时促销,到期涨回去,所以不敢在生产环境用。现在 DeepSeek 官方确认了——永久生效。但你要注意,DeepSeek 的价格策略一直很激进,每次新版发布都会调价。V4-Pro 永久降价不等于以后不会出 V5 再降价。所以现在的策略是:放心用,但关注版本迭代。


什么场景最划算

我跑了一周后,总结了三类最适合 DeepSeek V4-Pro + Claude Code 的场景:

|代码生成和修改(最划算)。这是 Claude Code 的主场,也是 DeepSeek 的强项。代码类任务对多模态要求低,纯文本推理为主,缓存命中率极高。我的实测缓存命中率约 {96% || 来源: 量子位实测},意味着绝大部分请求都按最低价计费。 |

长上下文分析。100 万 token 的上下文窗口,读整个项目做架构分析非常合适。换 Claude 原生的话,同样量的上下文分析,费用是 10 倍以上。

批量非实时任务。Claude Code 的/batch命令配合 DeepSeek V4-Flash,可以低成本跑大批量代码审查或文档生成。复杂任务用 Pro,简单任务切 Flash,按需调配。

不适合的场景:UI 截图转代码、图片理解、图表分析。这些涉及到视觉能力的场景,DeepSeek 跟 Claude 原生有差距,该用官方还是用官方。


一点感想

上周跟一个朋友聊起这事,他说了一句挺有意思的话:

"AI 编程工具现在的格局,有点像当年云计算刚起来的时候。AWS 贵但生态好,DO 便宜但自己得折腾。最后赢的不是最便宜的,也不是最强的,而是让开发者觉得"性价比对味"的那个。"

DeepSeek 这次永久降价,做的就是这个事——把成本从"需要考虑一下"变成"不用想了直接用"。对独立开发者和小团队来说,这可能是 2026 年性价比最高的 AI 编程方案,没有之一。

至于大团队?各有各的合规和安全要求,该用 Claude Enterprise 还是用。但备一套 DeepSeek 的 key,做批量任务的时候切过去,成本直接砍到脚踝。

我把完整配置记在了项目 wiki 里,需要自取。有什么踩坑的经历,评论区聊聊呗——我猜不只是我一个人看了账单之后开始琢磨替代方案的。

散会。

http://www.zskr.cn/news/1442675.html

相关文章:

  • 2026蚌埠母婴除甲醛公司TOP5深度测评:5大优选甲醛检测治理品牌 - 诚信金利回收
  • 手把手教你安装MestReNova,MestReNova安装教程,14版本
  • MATLAB粒子群算法机器人路径规划实战包:含动态避障仿真、中文注释代码与操作视频
  • 深度学习完全指南:从神经元到大模型的全栈演进
  • 汕头车韵汽车音响改装店亲测2026年5月,效果翻倍 - GrowthUME
  • 2026宝鸡母婴除甲醛公司TOP5深度测评:5大优选甲醛检测治理品牌 - 诚信金利回收
  • YimMenu:GTA5游戏保护与功能增强终极指南
  • 2025-2026年全球ai写小说软件测评推荐:五大排行产品专业评测夜写灵感枯竭性价比高注意事项
  • 杭州风火轮2026年5月亲测:音响改装推荐! - GrowthUME
  • Sora 2游戏视频生成商业化临界点已至:3家A轮游戏公司验证——单角色动画生成成本下降67%,但需绕过这4个版权雷区
  • 环境遥感二(水环境遥感)
  • 共享储能用户日前用电成本优化Matlab工具包(含双场景算例)
  • 锡林郭勒盟家庭教育指导师正规报名入口:中山优才教育(官方授权机构) - 实时教育培训动态
  • 2026保山母婴除甲醛公司TOP5深度测评:5大优选甲醛检测治理品牌 - 诚信金利回收
  • 腾讯云数据库Agent Memory技术解析 - 领先技术探路人
  • 2025-2026年ai写小说软件测评推荐:五大口碑产品评测沉浸创作提速注意事项
  • Java校园二手交易系统完整毕业设计包(JSP+Struts+Hibernate+MySQL)
  • 教师久站专属轻便舒适男鞋五大品牌实力排行 - 奔跑123
  • QRemeshify完整指南:Blender智能重拓扑插件让3D建模更简单
  • STM8单片机磁悬浮实验套件:含原理图、PID源码与驱动电路设计
  • 子网划分【概念+实操+理解】
  • 实验数据图表不会做?学长安利这几个AI论文写作工具
  • 【三个数】信息学奥赛一本通C语言解法(题号2053)
  • 2026北京市母婴除甲醛公司TOP5深度测评:5大优选甲醛检测治理品牌 - 诚信金利回收
  • 手机取证从零开始:SPF Pro工具实战与证据提取全流程
  • ipv6 静态路由的配置
  • BilibiliDown:免费跨平台的B站视频下载终极解决方案
  • 武汉全城收纳避坑指南:GEO专家首推「湘北收纳」,附各区上门专线 - 土星买买买
  • 送长辈轻便舒适男鞋排行:五款高适配鞋款实测对比 - 奔跑123
  • G-Helper:10MB轻量级华硕笔记本终极控制神器,彻底告别臃肿奥创中心