2026年OpenAI首秀自研推理芯片Jalapeño，每瓦性能优或改善Codex经济效益-尧图网络科技

Jalapeño芯片问世，全流程跑通

2026年6月24日，OpenAI首次向外界展示了其自研的首款定制AI推理芯片，代号Jalapeño。这颗芯片由OpenAI与Broadcom联合设计与制造，专为OpenAI推理系统的工作负载而优化。OpenAI表示，公司自家的AI模型也参与了芯片设计过程。虽然芯片仍在测试阶段，但早期结果显示其每瓦性能显著优于当前市场上最先进的替代方案。

对于密切关注AI基础设施竞争的人来说，Jalapeño的问世并不意外，但它落地的速度仍然值得关注。OpenAI与Broadcom的合作在2025年10月正式宣布，而在此之前，OpenAI自研芯片的传闻已经在业内流传了至少一年。早在2025年初，路透社就报道了OpenAI计划在当年完成首款定制芯片设计的消息。如今，这颗芯片以实物形态而非PPT的形式出现，意味着OpenAI从芯片设计到流片、再到测试验证的全流程已经跑通。

打破GPU垄断，OpenAI加入定制芯片行列

理解Jalapeño的战略意义，需要先厘清AI芯片市场当前的格局。过去五年，Nvidia的GPU几乎垄断了AI训练和推理的计算市场----从GPT - 4到Claude到Gemini，几乎所有前沿模型的训练和部署都依赖Nvidia的H100/B200系列芯片。这种依赖带来的问题是双重性的：一方面是成本，Nvidia的高端GPU售价长期维持在高位，且供不应求；另一方面是架构通用性的代价----GPU是为通用并行计算设计的，而非专门为Transformer架构或特定推理场景优化。这为定制芯片留下了明确的优化空间：如果能针对自家模型的特定计算模式定制硅片，理论上可以实现数倍的能效比提升。

Google是最早验证这条路线的公司。它的TPU（张量处理单元）从2016年起就为内部推理和训练工作负载提供支持，目前已经迭代到第六代。Amazon紧随其后，先后推出推理芯片Inferentia和训练芯片Trainium，为AWS上的AI客户提供Nvidia之外的选择。Jalapeño的亮相，标志着OpenAI也正式加入了这场"用定制硅片打破GPU垄断"的行列----而且它不是从零开始的。Broadcom在定制ASIC领域拥有数十年的经验，曾为Google、Meta等公司定制过数据中心芯片，这次合作本质上是OpenAI的算法知识加上Broadcom的工程能力的结合。

Broadcom角色关键，产业链权力结构转移

Broadcom在这场合作中的角色同样值得玩味。作为全球最大的定制ASIC设计公司之一，Broadcom的业务模式与Intel或AMD等通用芯片厂商有本质区别----它不制造可以在市场上公开销售的标准化芯片，而是为特定客户设计特定用途的定制硅片。在此之前，Broadcom已经为Google的TPU系列、Meta的推荐系统加速器等多个大型数据中心项目提供过定制芯片设计服务。与OpenAI的合作之所以引人注目，是因为它意味着Broadcom正在巩固自己在AI定制芯片设计领域的核心供应商地位----而当一家年营收超百亿美元的芯片巨头把AI模型公司视为最重要的长期客户群时，整个产业链的权力结构正在发生深刻的转移。

芯片策略明确，或改善Codex经济效益

OpenAI总裁Greg Brockman在合作宣布后的内部播客中解释了公司的芯片策略。他说，OpenAI对自家工作负载有"深入的理解"，一直在寻找那些被通用硬件"服务不充分"的特定场景----那些用GPU跑成本太高、但用定制芯片却可以大幅优化的计算模式。Jalapeño正是为推理场景定制的----即当用户向已训练好的AI模型发送请求时，模型生成响应的计算过程。在官方公告中，OpenAI特别强调了这颗芯片在运行实时编程模型时的低运营成本。这意味着对于Codex这类需要低延迟、高并发的代理式AI产品来说，Jalapeño可能带来直接的单位经济效益改善。

AI参与设计，展现"自举"效应

一个容易被忽略但同样重要的细节是：OpenAI的AI模型参与了Jalapeño的设计过程。这并非营销噱头。芯片设计中的布局布线、电源网络优化、时序收敛等环节存在大量的排列组合搜索空间，正是AI擅长的领域。Google DeepMind在2020年就展示了用强化学习优化芯片布局的能力，并在其TPU设计中实际部署了这一技术。OpenAI使用自家模型辅助芯片设计，意味着AI不仅在向上游（产品、应用）渗透，也在向下游（硬件、基础设施）延伸----用AI来设计运行AI的芯片，这种"自举"效应在工程意义上耐人寻味。

成本关注贯穿，垂直整合策略凸显

对成本的关注贯穿了Jalapeño的整个叙事。OpenAI在声明中特意指出："OpenAI不仅开发前沿模型或在其上构建产品，它还在设计其底层的基础设施：芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。因为OpenAI横跨整个技术栈，每一层都可以围绕同一个目标进行优化：让模型对用户来说更快、更可靠、更经济。"这段表述清晰地勾勒出了一种垂直整合策略，类似于苹果对iPhone的做法----控制从芯片到操作系统到应用的全链路，以换取性能和体验的最优解。

经济账可观，量产仍需时日

从商业角度审视，Jalapeño的经济账不难算。推理成本是目前AI商业化的核心瓶颈之一----当OpenAI以每月20美元或200美元的订阅价格向用户提供ChatGPT和ChatGPT Pro时，每一次对话、每一次代码生成都在消耗GPU的计算资源。如果定制芯片能将单次推理的能耗和时延降低30%到50%----考虑到Google TPU在类似场景中已经证明了这一量级的改进是可行的 ----那么无论是在保持价格不变的前提下提高毛利率，还是在降低价格的同时扩大用户基数，都给OpenAI提供了更多战略选择。尤其值得关注的是OpenAI特别提到实时编程模型的运行成本，这暗示了Codex及其衍生产品（如GitHub Copilot背后的模型服务）可能是Jalapeño首批承载的商业化负载之一。

当然，Jalapeño目前还远未到量产阶段。OpenAI坦承芯片仍在测试中，更重型的任务如预训练"可能仍将依赖Nvidia硬件"。考虑到芯片从测试到大规模部署通常需要一到两年时间，以及良率、散热、软件生态兼容性等一系列工程挑战，Jalapeño真正成为OpenAI推理基础设施的主力可能要到2027年至2028年。但即便如此，它的出现已经向市场传递了一个清晰的信号：AI模型公司正在向上游扩张，芯片将不再是只能向Nvidia购买的商品，而可以成为差异化的护城河。