上门服务 英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑
梦晨 发自 凹非寺上门服务
量子位 | 公众号 QbitAI英伟达最强芯片B200被动推迟三个月,神话闹的沸沸扬扬。
老黄的对策来了:阉割版芯片B200A曝光。
这难谈便是“产能不够,刀法来凑”?
没错,凭据SemiAnalysis分析,B200遭遇的主要问题恰是产能不及,更具体来说是台积电的新封装工艺CoWoS-L产能不及。
阉割版的B200A将先用于得志中低端AI系统的需求。
阉割版B200A,内存带宽缩水为什么说B200A是阉割版?
筹算上主要体当今内存带宽,4TB/s,比岁首发布会上B200宣传的8TB/s告成缩水一半。
这背后便是封装工艺由CoWoS-L清偿CoWoS-S了,以致B200A据称也兼容三星等其他非台积电的2.5D封装时期。
总的来说CoWoS先进封装刻下有三个变体,CoWoS-S、CoWoS-R和CoWoS-L,主要鉴识在中介层(interposer)的决议。
中介层介于芯片晶圆和印刷电路板之间,杀青芯片与封装基板之间的信推辞换,同期提供机械复旧和散热智商。
CoWoS-S结构最粗浅,中介层就格外于一派硅板。
CoWoS-R使用了RDL时期(Redistribution layer,再散播层),中介层是多层结构的薄金属材料。
CoWoS-L最复杂,在RDL中介层中加入了一种LSI芯片(Local Silicon Interconnect,局部硅互联),不错杀青更高布线密度,也不错作念成更大尺寸。
台积电推出CoWoS-L,是出于旧版时期在尺寸和性能不绝增长上靠近痛楚。
比如在AMD的AI加快芯片MI300上,CoWoS-S中介层一经扩大到了原圭臬的3.5倍,但仍难以得志改日AI芯片性能增长需求。
但当今,有音讯称CoWoS-L在产能攀升中遭遇一些问题,可能出现硅、中介层和基片之间的热扩张通盘不匹配,从而导致鬈曲,需要再行假想。
昔时台积电修复了大量的CoWoS-S产能,英伟达占据了最大份额。当今英伟达的需求不错飞速转向CoWoS-L,但台积电需要时期才调把产能调整到新工艺。
另外有音讯称,B200A的中枢(里面型号B102)将来也会用来造极度版B20,具体不张开了,懂得齐懂。
B200训大模子,还靠近其他挑战Blackwell主推的规格是“新一代诡计单位”GB200 NVL72,一个机柜就有36块CPU+72块GPU。
算力很到位,一个机柜在FP8精度的实践算力就高达720PFlops,直逼H100期间一个DGX SuperPod超等诡计机集群(1000 PFlops)。
但耗电也很到位,据Semianalysis估算,功率密度约为每个机柜125kW,前所未有。在供电、散热、收罗假想、并行、可靠性等方面带来挑战。
事实上,一经用于大模子实践的H100万卡集群,业界也还莫得全齐依从好。
比如Llama 3.1系列的时期敷陈就指出,实践期间平均3小时故障一次,其中GPU导致的问题占了58.7%。
策动419次故障中,148 次是由各式GPU故障(包括NVLink故障)引起,72次不错具体到是由HBM3内存故障引起。
是以总的来看,就算老黄最终发货了B200,AI巨头委果建好B200集群插足大模子实践,也还需要更多时期。
刻下一经开动实践或接近完成的GPT-5、Claude 3.5 Opus、Llama 4等怕是用不上了,要到下下代模子才调见证Blackwell的威力。
One More Thing针对B200推迟的神话,英伟达给出了官方回报:
Hopper的需求强盛,Blackwell的样品试用已平淡开动,产量有望下半年增多。
具体会不会延长三个月,不作念具体回报。
不外摩根士丹利在最新敷陈中相比乐不雅,合计坐褥仅会暂停约两周。
参考连续:
[1]https://x.com/dylan522p/status/1820200553512841239性交[2]https://www.semianalysis.com/p/nvidias-blackwell-reworked-shipment[3]https://3dfabric.tsmc.com/english/dedicatedFoundry/technology/cowos.htm[4]https://www.trendforce.com/news/2024/03/21/news-blackwell-enters-the-scene-a-closer-look-at-tsmcs-cowos-branch/[5]https://ieeexplore.ieee.org/document/9501649— 完 —
量子位 QbitAI · 头条号签约上门服务