出品 | 虎嗅科技组
作者 | 丸都山
编辑 | 苗正卿
头图 | 视觉中国
8月22日,据《The Information》报道,英伟达已通知安靠科技和三星电子等关键供应商暂停与H20芯片相关的生产。
而就在上周,美国白宫方面表示,英伟达已经同意将其在华销售芯片收入的15%上缴美国政府,以换取相关产品出口许可。
如果把这两条消息放在一起看,或许会得出一条结论:英伟达会再次终止H20芯片的对华销售。
但果真如此吗?需要说明的是,以目前AI算力芯片的产业格局来看,英伟达完全有能力将这部分上缴的收入转移到中国客户身上,且即便价格上涨18%(此涨幅下,收入端不变),在中国市场仍有较强的竞争力。
既然这样,英伟达为什么选择这个时间点通知供应链暂停生产?
虽然中国市场对于H20芯片的需求一贯强劲,但对于英伟达来说,这个产品可能并不算一门好生意。
准确地来说,在上代Hopper架构的GPU产品中,H20长期都是毛利率垫底的存在。
之所以会造成这个问题,是因为在BIS(美国商务部工业与安全局)规定下,英伟达H20本就是一枚“设计畸形”的芯片。比如在去年5月发布的BIS新规下,对“性能密度”做出限制,因此英伟达在设计H20时对算力规格大砍一刀,使其理论性能仅为296TFLOP,相当于H100芯片的15%。
又比如新规中取消了将“互联带宽”作为限制芯片的识别参数,英伟达就将H20的HBM3显存容量拉高到96Gb,使显存带宽提高到4.0Tb/s。
而这些特征组合在一起,却形成了一个很尴尬的事实:在算力大幅削减的情况下,H20的BOM(综合硬件成本)很可能跟H100齐平,甚至高于后者。
原因在于,存储颗粒一直是高性能计算卡成本的“大头”,比如H100芯片中,HBM3颗粒的采购就要占到60%左右,而在H20芯片上,英伟达又不得不为其配备更高规格的显存容量,以弥补算力不足的缺陷。
在今年4月,美国白宫又宣布,在未经许可的情况下,英伟达禁止向中国出售H20芯片,这直接导致英伟达在今年一季度积压的25亿美元订单无法交付,所有的H20库存积压和原材料采购承诺共计产生了45亿美元的费用。
后续黄仁勋在参加链博会时,又表示美国政府已经取消了针对H20的禁令,不过伴随这一连串的“反复横跳”,可以推导出两个基本事实:
首先,迄今为止,英伟达H20芯片的库存及原材料仍未被消耗掉,因此近期通知供应商停产很可能是一次正常的供应链调整,不能说明英伟达不打算在国内停售H20芯片。
其次,无论是H20最初设计构想,还是后续的库存积压,亦或是被强行征收了15%的所得税,都导致H20这枚芯片所带来的盈利能力愈发降低。
更重要的是,基于新架构Blackwell设计的B30A芯片即将在中国市场开售。
在Blackwell架构的首款产品芯片发布后,关于下一代“中国特供版”的消息便不胫而走。
目前,得到业界公认的一个说法是,这枚芯片被命名为B30A的芯片,采用与B300芯片同样的Blackwell Ultra微架构,但仅使用一个计算芯片(B300使用的是双芯片),提供约为B300性能和内存容量的一半。
同样在8月22日,黄仁勋造访台积电时透露,英伟达正在与美国政府磋商,讨论对中国出口一款新型人工智能芯片,这大概率就是坊间传言的B30A芯片。
不过,从二级市场的情绪来看,这款芯片在国内的前景可能并不完全明朗。在22日当天,寒武纪、海光信息两大国产GPU巨头双双20%涨停,直接强势带动整个“算力股”板块上涨。
这与去年年初H20开始供货时,A股算力股集体下跌形成截然不同的对比。
究其原因,或许有二。
一方面,从目前流传出的B30A规格来看,即便只使用一个die,其算力也很可能超过上代旗舰产品H100,未来这款产品能否顺利出口到中国,还充满着不确定性。
另外,本周DeepSeek-V3.1的发布为国产GPU带来了一大利好,即该版本模型使用了UE8M0 FP8 Scale的参数精度。在使用英伟达算力芯片时,由于需要兼容传统通FP8格式,硬件设计仍保留符号位逻辑,导致UE8M0的加速潜力无法完全释放。
但在国产芯片上,由于主流的GPU早已完成FlashMLA和DeepGEMM的适配,因此在DeepSeek-V3.1版本上可以实现无缝接入。
因此,至少在DeeSeek的模型训练上,国产GPU眼下仍具备一定的优势。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4731022.html?f=wyxwapp