英伟达战略收购Groq,200亿美元收编“竞争对手”

2025-12-26

当地时间12月24日,英伟达(NVIDIA)被传以约200亿美元现金收购人工智能芯片初创公司Groq的核心资产。这不仅创下英伟达有史以来最大规模的收购纪录(远超2019年70亿美元收购Mellanox),更意味着这家GPU巨头在AI推理赛道上完成了一次深远的战略布局。

这一消息是由曾领投Groq 7.5亿美元融资的美国投资机构Disruptive的CEO艾利克斯·戴维斯(Alex Davis)透露的。据悉,Groq并未被整体吞并,其云业务GroqCloud仍独立运营;创始人乔纳森·罗斯(Jonathan Ross)等核心高管将加入英伟达,但公司本身由新任CEO西蒙·爱德华兹继续领导;英伟达获得的是全部硬件资产与知识产权。

英伟达CEO黄仁勋在内部邮件中也明确表示:“我们并没有收购Groq这家公司,而是获得了其低延迟处理器技术的授权,并吸纳其顶尖人才。”但毫无疑问,英伟达200亿美元买下的不仅是一套“芯片设计”,更是一个通往下一代AI基础设施的关键拼图。

Groq:从TPU之父到LPU革命者

Groq的崛起,源于一位“天才工程师”的远见。该公司的创始人乔纳森·罗斯(Jonathan Ross)曾是谷歌TPU(张量处理单元)项目的核心缔造者。在谷歌广告系统工作的早期,他敏锐察觉到语音识别、搜索排序等AI任务对算力的巨大渴求。


借助谷歌著名的“20%自由时间”政策,罗斯秘密启动了一个实验性项目——这个项目最终演变为改变行业格局的TPU,一度支撑谷歌全球50%的算力需求。

2016年,罗斯离开Alphabet旗下的X实验室(前身为Google X),创办Groq,目标直指英伟达在AI推理领域的统治地位。他带来了一套颠覆性的架构理念:语言处理单元(LPU, Language Processing Unit)。与传统GPU依赖外部高带宽内存(HBM)不同,Groq的LPU在单芯片上集成了高达230MB的片上SRAM,提供惊人的80TB/s内存带宽——这一数据远超GPU方案。

图片来源:Groq

更重要的是,Groq摒弃了CPU/GPU中常见的乱序执行、分支预测等复杂机制,采用“确定性执行”微架构。其核心是张量流处理器(TSP, Tensor Streaming Processor)与一个功能强大的编译器协同工作:编译器精确调度每一项计算和数据流,实现周期级精准控制。这种“软件定义硬件”的模式,使得系统在分布式部署中仍能保持极低延迟和高吞吐,特别适合大模型推理场景。

实测数据显示,Groq在运行Llama 2、Mixtral等开源模型时,推理速度可达每秒500个tokens,响应速度比主流GPU快数倍,且单位token能耗仅为GPU的三分之一。Groq的目标并非取代训练芯片,而是抓住一个关键趋势:AI推理需求将很快超过训练需求。在这个“推理为王”的新时代,Groq试图成为基础设施级的高效引擎。

英伟达的战略焦虑:防御性扩张与生态闭环

尽管英伟达在AI训练市场占据绝对主导(市占率超80%),但推理市场正呈现百花齐放之势。Cerebras、SambaNova、Mythic等初创公司纷纷推出专用推理芯片;谷歌、亚马逊、微软也大力自研TPU、Trainium、Maia等替代方案。

更令英伟达警惕的是,Groq的LPU在特定场景下已展现出对A100/H100的性能优势,尤其在低延迟、高确定性任务中。

然而,除了Groq之外,Cerebras正加紧与英伟达竞争 ,力图打造用于运行生成式 AI 模型的处理器。该公司2024 年底提交了IPO申请,原计划今年上市,但在10月份宣布完成一轮融资并筹集了超过10亿美元后,撤回了其IPO申请。该公司一位发言人表示,Cerebras仍然希望尽快上市。

对于英伟达而言,与其等待Groq等壮大后成为真正对手,不如提前将其核心技术纳入麾下。

值得一提的是,此次交易并非传统并购,主要获得全部IP与硬件资产,包括LPU架构、TSP微架构、编译器技术,同时吸纳核心团队,尤其是罗斯这样的架构大师。不过,该交易排除GroqCloud业务,避免与自身DGX Cloud及合作伙伴(如CoreWeave)产生直接竞争。

英伟达这种策略,既强化了自身技术栈,又避免了整合风险。黄仁勋在邮件中强调,Groq的低延迟处理器将被集成进“NVIDIA AI工厂”架构,服务于更广泛的实时AI工作负载——这意味着LPU技术可能以IP模块形式融入下一代Blackwell或Rubin平台,成为CUDA生态的一部分。

据悉,Groq在被接洽前并无出售意愿,说明此次交易更多是英伟达主动发起的“防御性收购”。

EnfabricaGroq,构建更深生态护城河

实际上,除了英伟达之外,过去几年,包括Meta、谷歌和微软等科技巨头,均投入巨资,通过各种类型的许可协议,聘请顶尖的人工智能人才。

而这种“人才+IP”模式正成为英伟达应对创新挑战的标准操作。今年9月,英伟达就进行了一笔类似但规模较小的交易,当时该公司斥资超过9亿美元聘请了Enfabrica的首席执行官Rochan Sankar和这家人工智能硬件初创公司的其他员工,并获得了该公司的技术许可。

当前,英伟达加大了对芯片初创公司和更广泛生态系统的投资。该公司已投资人工智能和能源基础设施公司Crusoe、人工智能模型开发商Cohere,并增加了对CoreWeave的投资。

此外,英伟达此前还宣布计划向OpenAI投资高达1000亿美元,OpenAI承诺部署至少10吉瓦的英伟达产品。但两家公司尚未正式宣布达成协议。同时,英伟达向英特尔投资50亿美元的计划已经得到美国联邦贸易委员会(FTC)的审批。

英伟达之所以“大把撒钱”,在于其雄厚的现金储备。截至2025年10月,其现金及短期投资高达606亿美元,远高于2023年初的133亿美元。手握重金的黄仁勋显然不愿坐视所有潜在威胁成长,转而继续构建更坚固的生态护城河。