利用SRAM提升速度,应对“推理时代”
由三星晶圆代工生产

英伟达公开的“Groq 3”(Groq 3)是瞄准人工智能(AI)半导体竞争下一阶段的“新面孔”。有观点评价称,这是英伟达的一着“回心一棋”。


英伟达首席执行官(CEO)Jensen Huang于16日(当地时间)在美国圣何塞举行的开发者大会“GTC”主题演讲中宣布,将在下一代AI平台“Rubin”中加入“Groq 3 LPU”。Groq 3是一款为提升大规模AI模型在回答问题时生成答案的推理(inference)速度而设计的芯片。


AI产业正在从以模型训练为中心,急速转向以回答用户问题或需求的推理为中心。像Openclaw这样的智能体(Agentic AI)型人工智能迅速崛起,更加凸显了推理的重要性。

英伟达(Nvidia)首席执行官(CEO)黄仁勋(Jensen Huang)正在美国加利福尼亚州圣何塞SAP中心举行的年度开发者大会“GTC 2026”上发表主题演讲,时间为2026年3月16日(当地时间)。AFP联合通讯社供图

英伟达(Nvidia)首席执行官(CEO)黄仁勋(Jensen Huang)正在美国加利福尼亚州圣何塞SAP中心举行的年度开发者大会“GTC 2026”上发表主题演讲,时间为2026年3月16日(当地时间)。AFP联合通讯社供图

View original image

这款芯片之所以备受关注,还在于它是英伟达在收购AI半导体初创企业Groq的技术后,仅用3个月就推出的成果。英伟达在2024年12月投资约200亿美元,获取了在AI推理领域专业成长起来的Groq的核心资产和技术,并招募了相关工程师。


这也意味着,英伟达正在加紧应对那些试图从以GPU为中心的AI基础设施中“脱离”的原初性尝试。GPU在大规模训练方面优势明显,但在需要快速响应的推理任务中,可能出现瓶颈。


Groq 3为解决这一问题,选择了不同于现有AI芯片的路径。与大多数使用高带宽存储器(HBM)的GPU、神经网络处理器(NPU)不同,它采用搭载静态随机存取存储器(SRAM)的结构。SRAM速度快但成本高,因此主要承担中央处理器(CPU)和GPU缓存中所用的超高速存储器角色。虽然存储容量相对较小,但由于速度快,在推理阶段可以实现高效率。


在AI半导体竞争格局中,这也具有重要意义。近期AI算力市场上,低价推理专用芯片的竞争正在迅速扩散。将整片晶圆用作单一芯片的Cerebras正在加强与OpenAI、亚马逊Amazon Web Services的合作。韩国政府也在英伟达GPU采购之外,明确表示将支持国产神经网络处理器(NPU)。



与三星电子之间的关联也备受关注。Huang CEO表示,Groq 3芯片将由三星晶圆代工(Foundry)生产。三星把在SRAM领域的优势延伸到代工业务,承担Groq 3的生产。此前用于训练型GPU的高带宽存储器(HBM),为了与英伟达GPU结合,需要经过台湾台积电(TSMC)的封装工艺。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。