前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

OpenAI与Broadcom发布LLM推理芯片Jalapeño

产品2026年6月24日· 4 分钟阅读0 阅读

OpenAI与Broadcom今日发布首款自研推理芯片Jalapeño,专为大语言模型推理优化,性能功耗比显著优于现有产品。该芯片从设计到投产仅用9个月,计划2026年起部署于千兆瓦级数据中心,标志着OpenAI全栈战略从模型、产品延伸至芯片。

OpenAI与Broadcom(纳斯达克:AVGO)今日联合发布Jalapeño——OpenAI首款智能处理器。这款加速器围绕OpenAI对大语言模型推理的未来愿景设计,是双方共同打造的多代计算平台中的首款AI加速器,旨在让先进AI更快、更可靠、更易普及。

OpenAI与Broadcom高层展示Jalapeño推理芯片

Broadcom总裁兼CEO Hock Tan及总裁Charlie Kawwas将Jalapeño芯片交付给OpenAI CEO Sam Altman和总裁Greg Brockman,标志着OpenAI构建模型与产品全栈战略迈出关键一步。

OpenAI基于对LLM底层原理的深刻理解,并结合模型、内核、服务系统和产品需求的路线图,从零设计了这款芯片。合作伙伴Broadcom和Celestica协助完成了芯片实现、板级、机架系统集成、高性能网络及可扩展生产系统的工业化。Jalapeño具备灵活性,可适配当前及未来各类LLM,其设计依托OpenAI对整个行业推理需求的洞察。目前工程样片已在实验室中以目标频率和功耗运行ML工作负载,包括GPT-5.3-Codex-Spark。

虽然最终性能仍在测量中,但早期测试显示Jalapeño的性能功耗比将大幅优于现有最佳水平。详细的性能技术报告将在未来几个月发布。该架构通过减少数据移动并平衡计算、内存和网络资源,使实际利用率更接近理论峰值。Broadcom的硅实现和网络技术(包括Tomahawk网络芯片)助力平台实现大规模量产。

“世界正迈向算力驱动的经济,”OpenAI总裁兼联合创始人Greg Brockman表示,“Jalapeño是我们长期全栈基础设施战略的一部分,旨在让算力更充裕,使AI更快、更可靠、对个人和企业更实惠,并用于解决更重要的难题。通过自主设计更多栈层,我们能以更高效率提供更多智能,持续推动先进AI走向更广泛的应用。”

“Jalapeño是完全围绕LLM推理从头设计的,充分利用了与OpenAI研究人员紧密合作获得的信息,”OpenAI硬件项目负责人Richard Ho说,“我们针对前沿AI模型最关键的内核、内存移动、网络和服务模式优化了架构。早期测试表明,Jalapeño能在接近硬件理论极限的情况下高效执行我们最重要的负载。”

“与OpenAI的合作体现了为未来十年AI扩展物理基础设施的坚定承诺,”Broadcom总裁兼CEO Hock Tan表示,“这只是一个多代路线图的起点。通过与OpenAI直接联合开发业界领先的硅芯片,我们从2026年开始就能与微软等合作伙伴部署千兆瓦级数据中心。”

专为LLM打造的最佳推理平台

Jalapeño是为现代LLM推理设计的全新方案,并非从早期AI负载改造而来的通用加速器。它基于OpenAI每天运行ChatGPT、Codex、API及未来智能体产品的系统经验,同时兼顾整个行业当前和未来的LLM需求。目标是结合当今领先AI加速器的算力与吞吐量,以及最快专用推理系统的低延迟,使其非常适合大规模交互式LLM产品。

这就是全栈优势。OpenAI不仅开发前沿模型或在其上构建产品,还设计底层基础设施:芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。由于OpenAI覆盖了整个栈,每一层都可以围绕同一个目标优化:让模型更快、更可靠、对用户更实惠。

Jalapeño强化了OpenAI进步的飞轮效应。更好的基础设施提升计算效率,更高的计算效率带来更优的训练和服务,最终驱动更强大的AI模型。更好的模型为用户、开发者和企业提供更好的产品。更好的产品带来更多使用、更多客户和更多收入,让OpenAI能持续投资下一代基础设施。循环往复,让智能变得更强大、更可靠、更廉价。

九个月流片,OpenAI模型加速

Jalapeño从初始设计到制造流片仅用9个月,这一定制AI加速器项目据称创造了高性能先进半导体领域最快的ASIC开发周期。速度得益于OpenAI工程团队的软硬件协同开发、Broadcom的硅实现专长,以及利用OpenAI模型加速设计和优化流程。

服务于用户的同一批模型,也在帮助改进运行未来模型的基础设施。如果AI能帮助工程师更快地设计出更好的芯片,就能降低整个行业的计算成本,推动先进AI的普及。

与合作伙伴共建多代平台

Jalapeño是多代计算平台的第一步,计划2026年底前首次部署并持续扩展。平台融合了OpenAI设计的加速器、Broadcom的硅实现、网络和连接技术,以及Celestica的板级、机架和系统专长。

让先进AI触手可及

这项工作意义简单直接:推理是AI触达用户的环节。成本、速度和可靠性的每一次提升,都能转化为更快的ChatGPT回答、更少等待的Codex任务、更便宜的API产品构建,或在需求高峰时更可靠的访问。

普及AI意味着让先进模型足够可用、可靠、实惠,让更多人每天都能使用。Jalapeño帮助OpenAI将更多基础设施转化为有用的智能,服务学生、开发者、小企业、研究人员、企业以及所有试图学习、创造或解决难题的人。

标签:OpenAIJalapeño推理芯片大语言模型

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

Claude Tag 发布:团队协作新方式
TOP1

Claude Tag 发布:团队协作新方式

官方确认Anthropic AI发现美国机密系统漏洞
TOP2

官方确认Anthropic AI发现美国机密系统漏洞

3

Anthropic推出Claude Tag:Slack里的AI队友

15小时前
Anthropic推出Claude Tag:Slack里的AI队友
4

Legion LegalTech 起诉美政府封禁 Anthropic 模型

15小时前
Legion LegalTech 起诉美政府封禁 Anthropic 模型
5

字节跳动发布豆包2.1 Pro 称性能超越Claude Opus

15小时前
字节跳动发布豆包2.1 Pro 称性能超越Claude Opus
6

Meta 推出自有品牌 AI 智能眼镜,售价 299 美元起

15小时前
Meta 推出自有品牌 AI 智能眼镜,售价 299 美元起
7

英伟达被禁AI芯片黑市价格翻倍

15小时前
英伟达被禁AI芯片黑市价格翻倍
8

Agility Robotics借SPAC上市估值25亿美元

10小时前
Agility Robotics借SPAC上市估值25亿美元
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款