
在GTC 2026主题演讲上,一款名为英伟达Groq 3 LPU的全新芯片认真亮相。
北京时分周二凌晨,英伟达认真推出Vera Rubin平台,包括Groq 3 LPU(简称LPU)在内,测度搭载了七款芯片,分歧为Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超等网卡、BlueField-4 DPU和Spectrum-6以太网交换机。
据悉,英伟达将构建包含256个LPU的Groq 3 LPX机架,提供128GB(每个LPU集成500MB的SRAM)的SRAM和40 PB/s的推理加快带宽,并通过每个机架640 TB/s的专用膨胀接口将这些芯片一语气起来。这款机架将与Vera Rubin NVL72、Vera CPU等另外四款机架一同组成完整的AI超等计算机平台Vera Rubin。
英伟达暗示,Groq 3 LPX 是Vera Rubin的推理加快器,旨在餍足智能体系统对低蔓延和大波折文的需求。Vera Rubin和LPX通过协同假想的架构,将Rubin GPU和LPU的超卓性能完好意思陆续,使其呈现极低蔓延与超大费解量的特质。
黄仁勋先容称,LPX与Vera Rubin平台陆续后,推理费解量/功耗比将能擢升35倍。LPU芯片将由三星代工,瞻望机架将于本年下半年启动出货。
就在昨日,分析师郭明錤发文称,在英伟达投资Groq之后,LPU的出货量预测已大幅上调。瞻望2026至2027年的总出货量将达到400万至500万颗。新架构机柜瞻望于本年第四季度启动量产,2026年与2027年机柜出货量分歧约为300至500个,以及15000至20000个。
在他看来,LPU需求增长快速增长主要来自外部身分。一方面,LPU与英伟达生态系(如CUDA)高度整合,大幅阻抑诓骗成立与部署门槛。另一方面,如今业内超低蔓延推理需求快速增多,包括AI智能体(AI Agents)以及正在兴起的即时处置(Real-Time)、结尾用户(Consumer-Facing)与物理AI(Physical-AI)等类型诓骗。
值得一提的是,黄仁勋在主题演讲上也强调,AI已完成从感知智能到生成智能,再到物千里着平安能和智能体智能的要害跃迁。
财通证券指出,大模子在推理经过中会存在蔓延,蔓延与用户体验感良好挂钩,大模子推理经过中的蔓延主要在Decode阶段,中枢瓶颈在于内存带宽。LPU具备更快的内存带宽,可缩小大模子推理经过中的蔓延。同期,基于LPU的大模子不仅具有更快的推理速率,还不错提供更具性价比的价钱,可进一步提高用户体验感。
该机构暗示,当今Tokens的销耗量大幅增长,带动推理芯片阛阓限制的高增长。LPU有望在推理芯片阛阓中逐步渗入,具有高成长性的阛阓空间。看好LPU的高成长性及LPU以机柜出货时带来的PCB契机,提议关心:智微智能(参股元川微)、星宸科技(多轮增资元川微)、沪电股份(英伟达PCB供应商)、胜宏科技(英伟达PCB供应商)、深南电路。
