OpenAI自研芯片Jalapeño发布:推理成本真能降50%?

2026年6月24日,人工智能公司OpenAI与半导体巨头博通(Broadcom)联合发布其首款定制AI芯片“Jalapeño”,标志着两家公司在构建自主AI基础设施方面迈出关键一步。根据当日公开披露的信息,该芯片专为大语言模型(LLM)的推理任务设计,目标是在运行如ChatGPT等生成式AI应用时,显著提升能效并降低运营成本。博通首席执行官陈福阳(Hock Tan)在采访中表示,Jalapeño在性能上可与英伟达(NVIDIA)最新Blackwell系列GPU及谷歌的张量处理单元(TPU)相媲美,并称其部署将帮助OpenAI节省约50%的推理成本。消息公布后,博通美股盘前交易上涨3%。
芯片定位与技术路径:聚焦推理效率
Jalapeño并非通用型AI加速器,而是针对推理阶段——即模型接收用户输入后生成响应的过程——进行高度优化。这一选择反映了当前AI行业的一个核心痛点:尽管训练阶段消耗大量算力,但随着模型部署规模扩大,推理成本已逐渐成为长期运营的主要支出项。OpenAI硬件负责人Richard Ho指出,Jalapeño的设计目标是“在各类未来大语言模型迭代中保持高性能”,并已在内部实验室中成功运行其GPT-5.3-Codex-Spark模型,达到预期功耗与频率指标。
值得注意的是,该芯片从初始设计到完成流片(tape-out)仅耗时约九个月,远快于传统芯片开发周期。OpenAI透露,这一加速部分得益于AI工具在设计流程中的应用。芯片制造由台积电(TSMC)承担,而服务器系统则由加拿大电子制造服务商Celestica负责组装。所有硬件将仅供OpenAI内部使用,暂无对外销售计划。
供应链合作与商业现实
此次合作延续了近年来科技巨头与专业半导体公司协同开发定制芯片的趋势。Meta、亚马逊和谷歌此前均已通过与博通、Marvell等公司合作,开发用于自身数据中心的AI加速器。OpenAI选择博通,不仅因其在高速互连和网络芯片领域的深厚积累(如Tomahawk交换芯片技术),也因后者具备将复杂系统级芯片(SoC)快速落地的能力。
然而,陈福阳也坦承当前定制AI芯片业务对博通而言并非高利润领域。由于AI芯片对高带宽内存(HBM)的依赖激增,而HBM主要由SK海力士和三星电子供应,原材料成本压力压缩了整体毛利率。相较之下,博通传统的网络交换芯片等产品仍维持更高盈利水平。这表明,尽管AI芯片订单带来营收增长,但其对博通整体盈利能力的贡献仍需观察后续规模效应与供应链优化进展。
部署节奏与战略意义
OpenAI计划在2026年底前完成Jalapeño的初步部署,并将其作为多代芯片路线图的起点。官方文件提及,该项目瞄准“吉瓦级”(gigawatt-scale)数据中心部署,强调“每瓦性能”(performance per watt)的提升,这直接回应了当前AI数据中心面临的能源瓶颈。随着全球对AI算力需求持续攀升,电力供应与散热成本已成为制约扩张的关键因素。通过定制芯片优化能效,OpenAI不仅可降低单位查询成本,还能缓解对第三方GPU供应商的依赖——尤其是在英伟达GPU长期供不应求的背景下。
此举亦凸显OpenAI从纯软件模型公司向垂直整合基础设施运营商的转型。自2023年首次传出自研芯片意向以来,该公司逐步构建涵盖芯片设计、服务器集成与数据中心运营的全栈能力。这种模式虽需巨额前期投入,但一旦形成规模,将显著提升其在AI竞赛中的长期竞争力与成本控制力。
市场影响与行业格局
博通股价在消息公布后盘前上涨3%,反映出市场对其在AI定制芯片领域地位的认可。作为少数能提供完整芯片设计IP与制造对接服务的半导体公司,博通正成为AI原生企业构建自主算力的关键合作伙伴。与此同时,英伟达虽仍主导训练市场,但在推理端面临越来越多来自定制化方案的竞争。谷歌TPU、亚马逊Trainium/Inferentia以及如今OpenAI的Jalapeño,均试图在特定工作负载上实现性能与成本的最优平衡。
不过,Jalapeño的实际效能与成本优势仍需大规模部署后验证。目前工程样品虽运行稳定,但量产良率、长期可靠性及与现有软件栈的兼容性仍是未知数。此外,50%的成本节省声明尚未披露具体测算基准(例如对比的是Blackwell GPU的采购价还是总拥有成本),投资者应保持审慎。
总体而言,OpenAI与博通的此次合作不仅是技术发布,更是AI基础设施范式转变的缩影:头部玩家正从“租用算力”转向“自建算力”,以掌控成本、性能与创新节奏。在AI军备竞赛进入深水区的2026年,谁能更高效地将电力转化为智能,谁就可能在下一阶段占据先机。












