OpenAI与Broadcom发布LLM推理芯片Jalapeño

产品2026年6月24日· 4 分钟阅读0 阅读

OpenAI与Broadcom今日发布首款自研推理芯片Jalapeño，专为大语言模型推理优化，性能功耗比显著优于现有产品。该芯片从设计到投产仅用9个月，计划2026年起部署于千兆瓦级数据中心，标志着OpenAI全栈战略从模型、产品延伸至芯片。

OpenAI与Broadcom（纳斯达克：AVGO）今日联合发布Jalapeño——OpenAI首款智能处理器。这款加速器围绕OpenAI对大语言模型推理的未来愿景设计，是双方共同打造的多代计算平台中的首款AI加速器，旨在让先进AI更快、更可靠、更易普及。

OpenAI与Broadcom高层展示Jalapeño推理芯片

Broadcom总裁兼CEO Hock Tan及总裁Charlie Kawwas将Jalapeño芯片交付给OpenAI CEO Sam Altman和总裁Greg Brockman，标志着OpenAI构建模型与产品全栈战略迈出关键一步。

OpenAI基于对LLM底层原理的深刻理解，并结合模型、内核、服务系统和产品需求的路线图，从零设计了这款芯片。合作伙伴Broadcom和Celestica协助完成了芯片实现、板级、机架系统集成、高性能网络及可扩展生产系统的工业化。Jalapeño具备灵活性，可适配当前及未来各类LLM，其设计依托OpenAI对整个行业推理需求的洞察。目前工程样片已在实验室中以目标频率和功耗运行ML工作负载，包括GPT-5.3-Codex-Spark。

虽然最终性能仍在测量中，但早期测试显示Jalapeño的性能功耗比将大幅优于现有最佳水平。详细的性能技术报告将在未来几个月发布。该架构通过减少数据移动并平衡计算、内存和网络资源，使实际利用率更接近理论峰值。Broadcom的硅实现和网络技术（包括Tomahawk网络芯片）助力平台实现大规模量产。

“世界正迈向算力驱动的经济，”OpenAI总裁兼联合创始人Greg Brockman表示，“Jalapeño是我们长期全栈基础设施战略的一部分，旨在让算力更充裕，使AI更快、更可靠、对个人和企业更实惠，并用于解决更重要的难题。通过自主设计更多栈层，我们能以更高效率提供更多智能，持续推动先进AI走向更广泛的应用。”

“Jalapeño是完全围绕LLM推理从头设计的，充分利用了与OpenAI研究人员紧密合作获得的信息，”OpenAI硬件项目负责人Richard Ho说，“我们针对前沿AI模型最关键的内核、内存移动、网络和服务模式优化了架构。早期测试表明，Jalapeño能在接近硬件理论极限的情况下高效执行我们最重要的负载。”

“与OpenAI的合作体现了为未来十年AI扩展物理基础设施的坚定承诺，”Broadcom总裁兼CEO Hock Tan表示，“这只是一个多代路线图的起点。通过与OpenAI直接联合开发业界领先的硅芯片，我们从2026年开始就能与微软等合作伙伴部署千兆瓦级数据中心。”

专为LLM打造的最佳推理平台

Jalapeño是为现代LLM推理设计的全新方案，并非从早期AI负载改造而来的通用加速器。它基于OpenAI每天运行ChatGPT、Codex、API及未来智能体产品的系统经验，同时兼顾整个行业当前和未来的LLM需求。目标是结合当今领先AI加速器的算力与吞吐量，以及最快专用推理系统的低延迟，使其非常适合大规模交互式LLM产品。

这就是全栈优势。OpenAI不仅开发前沿模型或在其上构建产品，还设计底层基础设施：芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。由于OpenAI覆盖了整个栈，每一层都可以围绕同一个目标优化：让模型更快、更可靠、对用户更实惠。

Jalapeño强化了OpenAI进步的飞轮效应。更好的基础设施提升计算效率，更高的计算效率带来更优的训练和服务，最终驱动更强大的AI模型。更好的模型为用户、开发者和企业提供更好的产品。更好的产品带来更多使用、更多客户和更多收入，让OpenAI能持续投资下一代基础设施。循环往复，让智能变得更强大、更可靠、更廉价。