OpenAI与Cerebras达成超100亿美元AI推理芯片合作协议
创始人
2026-01-16 20:23:21
0

OpenAI宣布将在2028年前部署750兆瓦容量的Cerebras晶圆级加速器,以增强其推理服务能力。据知情人士透露,这项协议价值超过100亿美元,Cerebras将承担为OpenAI建设和租赁数据中心的风险。

通过将Cerebras的晶圆级计算架构集成到推理管道中,OpenAI可以利用该芯片的大容量SRAM来加速推理过程。Cerebras的WSE-3加速器芯片面积达到46,225平方毫米,配备44GB的SRAM。

与现代GPU上的HBM相比,SRAM的速度要快几个数量级。单颗Nvidia Rubin GPU可以提供约22TB/s的内存带宽,而Cerebras芯片的带宽达到21PB/s,几乎是前者的1000倍。

这种带宽优势转化为极快的推理性能。在运行OpenAI的gpt-oss 120B等模型时,Cerebras芯片据称可以达到每秒3,098个Token的单用户性能,相比之下使用Nvidia GPU的竞争对手Together AI仅为885Token/s。

在推理模型和智能体时代,更快的推理意味着模型可以在不影响交互性的情况下进行更长时间的"思考"。OpenAI在最近的博客文章中解释道:"将Cerebras集成到我们的计算解决方案组合中,目的是让AI响应更快。当你提出复杂问题、生成代码、创建图像或运行智能体时,后台会发生一个循环过程:发送请求、模型思考、返回结果。当AI能够实时响应时,用户会更多地使用它,停留时间更长,运行更高价值的工作负载。"

然而,Cerebras的架构也有一些局限性。SRAM在空间效率方面表现不佳,这就是为什么尽管芯片尺寸令人印象深刻,但其内存容量仅相当于六年前的Nvidia A100 PCIe卡。

因此,更大的模型需要在多个芯片间并行化处理,每个芯片的功耗高达23千瓦。根据使用的精度,所需的芯片数量可能相当可观。在Cerebras历史上偏好的16位精度下,每十亿参数需要消耗2GB的SRAM容量。因此,即使是Llama 3 70B这样的中等规模模型也需要至少四个CS-3加速器才能运行。

距离Cerebras发布新的晶圆级加速器已经近两年了,期间公司的重点已从训练转向推理。我们预计该公司的下一款芯片可能会为SRAM分配更大的面积,并增加对MXFP4等现代块浮点数据类型的支持,这应该能显著增加单芯片可服务的模型规模。

话说回来,去年夏天随着OpenAI GPT-5发布而引入的模型路由器应该有助于缓解Cerebras的内存限制。这种方法确保ChatGPT处理的绝大多数请求都由较小的成本优化模型来完成,只有最复杂的查询才会在OpenAI最大且最耗资源的模型上运行。

OpenAI也可能选择在Cerebras设备上运行部分推理管道。过去一年中,分离式推理的概念开始兴起。

理论上,OpenAI可以在AMD或Nvidia GPU上运行计算密集的提示处理,然后将Token生成任务卸载到Cerebras的SRAM密集型加速器上,用于处理带宽受限的Token生成阶段。这是否真的可行将取决于Cerebras。

当被问及在分离式计算架构中使用CS-3的可能性时,Cerebras公司发言人表示:"这是一项云服务协议。我们为OpenAI建设配备我们设备的数据中心,为他们的模型提供最快的推理能力。"

这并不意味着不会发生,但需要Cerebras在其数据中心内与晶圆级加速器一起部署支持此类配置所需的GPU系统。

Q&A

Q1:Cerebras的WSE-3加速器相比Nvidia GPU有什么优势?

A:Cerebras的WSE-3加速器拥有21PB/s的内存带宽,几乎是Nvidia Rubin GPU(22TB/s)的1000倍。在运行推理任务时,WSE-3可以达到每秒3,098个Token的性能,而使用Nvidia GPU的竞争对手仅为885Token/s。这主要得益于其大容量SRAM的超高带宽特性。

Q2:Cerebras芯片有哪些技术限制?

A:主要限制是SRAM空间效率不高,尽管芯片面积达46,225平方毫米,但内存容量仅相当于六年前的Nvidia A100 PCIe卡。大型模型需要多芯片并行处理,每个芯片功耗高达23千瓦。在16位精度下,每十亿参数需要2GB SRAM,连Llama 3 70B这样的模型都需要至少四个芯片。

Q3:OpenAI为什么选择与Cerebras合作而不是继续使用Nvidia?

A:OpenAI选择Cerebras主要是为了获得更快的推理速度。在智能体和推理模型时代,更快的推理让模型可以进行更长时间的"思考"而不影响交互性。当AI能实时响应时,用户会更多使用、停留更久、运行更高价值的工作负载。Cerebras的超高带宽SRAM架构特别适合推理任务的需求。

相关内容

世界最大跨径钢拱桥 武两高...
来源:央视新闻客户端6月12日,随着最后一片钢混组合梁在百米高空完...
2026-06-12 23:02:18
专访|中国“以发展促人权”...
来源:新华社新华社北京6月12日电 专访丨中国“以发展促人权”实践...
2026-06-12 23:00:50
世界古典学大会代表:汲取古...
  新华社雅典6月11日电(记者陈刚)第二届世界古典学大会10日在...
2026-06-12 23:00:02
乌海市苦练支前硬功,筑牢双...
转自:草原云6月11日至12日,由乌海市委宣传部、市退役军人事务局...
2026-06-12 22:59:34
ST联创:撤销其他风险警示...
来源:硬码科技派6月12日,ST联创公告称,公司撤销其他风险警示的...
2026-06-12 22:58:54
图集|一起来看“中国好人榜...
  6月11日,“中国好人榜”发布仪式在河北省邢台市举办,现场揭晓...
2026-06-12 22:58:18
甘肃成县文旅“三字经”:诗...
中新网兰州6月12日电 (高文 刘建军)盛夏时节,甘肃陇南市成县杜...
2026-06-12 22:57:37
银川共享电单车实施“强制戴...
中新网银川6月12日电 (记者 李佩珊)6月12日傍晚,正值下班通...
2026-06-12 22:57:00
长春汽车职业技术大学光博会...
仲夏春城,科创潮涌。12日,第三届长春国际光电博览会·Light国...
2026-06-12 22:56:15

热门资讯

银行板块逆势走强 重庆银行涨近... 5月29日,银行板块逆势走强,截至14时06分,重庆银行涨近6%,宁波银行、兴业银行、长沙银行、招商...
埃夫特:发行股份及支付现金购买... 5月29日,埃夫特-U(688165.SH)公告,公司拟通过发行股份及支付现金方式购买上海盛普流体设...
浦发银行招标结果:上海浦东发展... 证券之星消息,根据天眼查APP-财产线索数据整理,上海浦东发展银行股份有限公司5月26日发布《上海浦...
多家银行调整积存金业务,黄金投... 国际金价持续波动,近期多家银行再度调整积存金业务,包括下调产品风险等级、延长交易时间、推出手续费优惠...
当代打工人,把阿福用成了“工伤... 最近,打工人们开始玩起了一种新型的职业猜猜乐。 给出的信息,既不是电脑桌面,也不是工作细节。 而是蚂...
面值250美元!特朗普要把自己... 当地时间5月28日,特朗普政府在白宫新闻发布会上确认,正在推动国会批准发行一款印有特朗普肖像的250...
又升了!人民币兑美元汇率盘中续... 5月29日,在岸人民币、离岸人民币兑美元汇率双双升值,盘中续创2023年2月以来新高。同日,人民币汇...
三菱汽车宣布未来四年投资1万亿... 观点网讯:5月29日,三菱汽车对外宣布,计划在未来四年内投资1万亿日元,以推进企业增长战略。 信息显...
下周央行公开市场将有9089亿... 钛媒体App 5月29日消息,Wind数据显示,下周央行公开市场将有9089亿元逆回购到期,其中下周...
印尼盾汇率连跌五日 印尼央行出... 中新社雅加达5月29日电 (记者 李志全)印度尼西亚本币印尼盾持续走低,29日一度逼近1美元兑179...