当地时间6月24日,OpenAI正式发布首款专为大语言模型定制的AI芯片,名叫Jalapeño,翻译过来叫哈拉帕辣椒。
辣椒是由OpenAI与博通公司合作设计和制造的,并不是一款用来训练模型的通用GPU,而是专门为OpenAI推理系统的独特需求而设计的。
辣椒从最初的设计到最终流片仅用了9个月的时间。为什么有这么快的研发速度呢?据OpenAI透露,他们直接调用了自己的AI模型来协助芯片的设计与优化,实现了极快的软硬件协同。
成本方面,博通CEO陈福阳就指出,与市面上普通的AI GPU相比,这款定制化ASIC能带来50%的成本节省。
性能方面,虽然辣椒仍在测试中,因为该芯片设计直接基于OpenAI对LLM底层逻辑、内核及服务系统的理解。早期实验室测试表明,它的每瓦特性能显著优于目前市面上的主流芯片。目前,它已经在OpenAI的实验室中成功运行GPT-5.3-Codex-Spark 模型。
虽然,辣椒的设计是OpenAI和博通合作设计的,但负责晶圆制造的是台积电,负责将芯片组装成定制化的服务器系统的是Celestica,而首批部署地是微软的数据中心。
辣椒预计将在今年下半年开始并入大型数据中心,并在2027年实现大规模量产。
对于OpenAI来说,辣椒这款定制芯片是OpenAI迈向全栈架构(从模型、软件、服务到硬件芯片)的关键一步,旨在减少对英伟达GPU的绝对依赖,并大幅降低极其高昂的推理成本。这也就意味着OpenAI将拥有更高的毛利率,从而显著改善公司的盈利状况。