科技专题研究:GTC启示:关注光通信_交换机_液冷.pdf

英伟达GTC 2024大会启示:关注光模块/交换机/液冷新变化
北京时间3月19日,英伟达GTC 2024拉开帷幕,黄仁勋发表“见证Al的变革时刻”演讲,发布数款计算/网络新品及架构。我们看到:1)光模块:GB200集群中单GPU对外互联带宽进一步提升,有望带动1.6T光模块需
求的加速释放;2)交换机:英伟达IB与以太网并重,全球首次实现端到端800G吞吐,我们看好以太网交换机在未来推理时代的应用潜力;3)液冷:GB200机架将搭载液冷系统,节省20KW功耗,芯片端背书+服务器端扩产+运营商端愿景有望共同促进液冷技术落地,利好相关设备商及IDC。建议关注:中际旭创、英维克、紫光股份、润泽科技。
光模块:GB200重磅亮相,单GPU对外互联带宽进一步提升
本届大会中,最新一代GB200芯片重磅亮相,市场关注GB200架构对于光模块需求端的影响。2023年5月英伟达发布了GH200,其在256颗集群中单颗GPU与800G光模块的配比高达1:9。根据黄仁勋此次演讲中的展示,最新发布的GB200单芯片对外互联带宽进一步升级,从此前900GB/s提高到1800GB/s(双向)。集群方面,单机柜最高可容纳72颗Blackwell GPU,通过新一代NVLink5交换机可让576颗GPU互联;通过IB/以太网交换机可进一步扩大至万颗以上。仅考虑NVLink下的576颗GPU集群,我们测算单颗Blackwell GPU所匹配的1.6T光模块达到1:9。
交换机:Al网络高速化趋势持续,800G产品有望逐步放量
英伟达发布Quantum-X800 InifiniBand和Spectrum-X800以太网交换机,为全球首批实现端到端800GB/s吞吐量的网络平台。其中Quantum-X800相比上一代,使用SHARPv4下的带宽容量提高5倍、网络计算能力增加9
倍至14.4TFlops。此外,英伟达GPU间互联升级至NVLink 5,可在单个NVLink域中连接576个GPU,每个GPU以1.8TB/s的双向吞吐量通信。我们看到,Al网络高速化趋势持续,且英伟达仍注重Spectrum以太网产品,或在为即将到来的推理段市场做准备;随着国内以太网交换机厂商产品持续迭代,有望凭借以太网技术积累及性价比在未来推理市场迎来可观增长。
液冷:GB200首发搭载液冷系统,产业链各参与方共促技术落地
英伟达GB200机架具有2英里长的NVLink布线,共5,000根电缆,功耗达20KW,黄仁勋称“为了让这些计算快速运行,将采用液冷的设计方案,冷却液输入/输出水温分别为25℃/45℃”。根据Dell’Oro预测,到2027年全球液冷市场规模将接近20亿美元。我们看到,在全球Al芯片龙头的背书下,近期服务器厂商也相继布局或扩产液冷机架(如鸿海参与本次GB200液冷机架设计,超微电脑宣布Q2内扩产液冷机架),叠加国内三大运营商25年及以后50%以上项目使用液冷的产业愿景,液冷渗透率有望持续提升。
投资建议
我们认为随着Al产业的快速迭代,算力产业链需求仍有望保持快速上行,在此背景下建议关注光模块、上游光器件&光引擎、MPO(高密度连接器)、交换机等行业发展机遇。此外液冷方案在数据中心中的渗透率亦有望保持提升态势。建议关注:中际旭创、英维克、紫光股份、润泽科技。
风险提示:宏观经济影响;行业竞争加剧;新技术推进不及预期。英伟达GTC大会启示:关注光通信、交换机、液冷
北京时间3月19日,英伟达GTC 2024拉开帷幕,黄仁勋发表“见证Al的变革时刻”演讲,发布数款计算/网络新品及架构。我们看到:1)光模块:GB200集群中单GPU对外互联带宽进一步提升,有望带动1.6T光模块需求的加速释放;2)交换机:英伟达IB与以太网并重,全球首次实现端到端800G吞吐,我们看好以太网交换机在未来推理时代的应
用潜力;3)液冷:GB200机架将搭载液冷系统,节省20KW功耗,芯片端背书+服务器端扩产+运营商端愿景有望共同促进液冷技术落地,利好相关设备商及IDC。
光模块:GB200外联带宽进一步提升,1.6T加速导入
英伟达在本次GTC大会中发布了最新一代GB200芯片,市场关注GB200架构对于光模块需求端的影响。回顾2023年5月底的COMPUTEX大会上,英伟达首次发布了GH200,根据我们的测算,其在256颗集群中所匹配的800G光模块为2304只(即单颗配比高达
1:9),本次最新发布的GB200亦沿用该理念,根据黄仁勋演讲中的展示,单GPU互联带宽(双向)从此前900GB/s提高到1800GB/s。集群方面,单机柜最高可容纳72颗BlackwellGPU,通过新一代NVLink5交换机可让576颗GPU互联;通过IB/以太网交换机可将集群规模进一步扩大至万颗以上。仅考虑576颗GPU的集群,我们预计单颗Blackwell GPU
所匹配的1.6T光模块达到1:9。
DGX GH200集群中,单颗GPU对外互联带宽为900GB(双向)。GH200网络架构采用了胖树无阻塞结构,包括L1交换机和L2交换机层,我们用流量法自下而上进行测算,各
层级带宽情况为:1)芯片接入层:单个GH200芯片匹配的双向外联带宽为900GB/s,即单向450GB/s,则全部256个芯片带来的接入带宽为256×450GB/s =115.2TB/s;2)芯片层与L1层之间:使用背板互联,无光模块需求;3)L1层与L2层之间:256颗芯片带
来的流量为115.2TB /s,单个800G光模块传输能力为100GB/s,单向传输需要115.2TB/100GB=1152个光模块,即L1层上行链路和L2层下行链路分别需要1152光模块,共需要2304光模块。由此推导出GH200芯片与800G光模块数量配比为1:9。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)