11选5彩票官网

你的位置: 11选5彩票官网 > 新闻动态 >
新闻动态
微软大量部署Blackwell GPU, 英伟达员工吐槽冷却系统“太浪费”
发布日期:2025-12-18 08:23    点击次数:138

IT之家12月12日消息,英伟达正在为微软的数据中心提供最新一代Blackwell芯片,而在今年初秋的部署过程中,英伟达一名员工注意到,微软其中一处设施的冷却方式显得过于浪费。

随着AI模型训练与推理的算力需求迅猛攀升,英伟达正为微软等科技巨头大量部署GB200Blackwell系统。

今年初秋时,英伟达基础设施专家团队的员工在内部邮件中,详细描述了为OpenAI机群部署Blackwell机架的现场情况。作为OpenAI的云合作伙伴与最大投资方,此类部署由微软负责。

《商业内幕》今天援引的英伟达内部邮件提到,此次安装包括两组GB200NVL72机架,每组搭载72颗英伟达GPU。由于如此高密度的GPU阵列会产生巨量热能,微软采用液冷技术将热量从服务器周围迅速带走。

但邮件也指出,微软在建筑层面的整体冷却方式因规模过大且未使用设施级冷却用水,看起来造成资源浪费,但确实带来了良好的弹性与故障容忍能力。

美国加州大学的电气与计算机工程副教授任绍雷(音译)解释说,数据中心通常采用“双层冷却结构”:服务器内部用液冷,而建筑本体需要另一套系统把整体热量排到室外。

因此,邮件所说“浪费”的冷却方式,或指微软采用空气冷却作为建筑级散热,而非使用水冷。任绍雷说,空气冷却虽然能源消耗更高,但不耗水。水资源可见性强,往往会引起公众对用水问题的关注,使企业在能源消耗、水资源压力与舆论反应之间必须进行权衡。

IT之家从报道中获悉,微软发言人回应说,“微软的液冷换热器单元是一个闭环系统,我们将其部署在现有的风冷数据中心中,以增强第一方和第三方平台上的冷却能力。该系统确保我们最大限度地利用现有的全球数据中心规模,同时促进高效散热并优化电力输送,以满足AI和超大规模系统的需求。”

微软方面强调在2030年前达成“碳负排放、净产水与零废弃”的企业目标,并表示下一代数据中心将采用零用水冷却设计,同时推进芯片级冷却技术。

邮件同样强调,Blackwell量产硬件品质明显高于此前送给客户试验的早期样品。两组GB200NVL72机架在特定计算性能测试中均达到100%通过率,反映出量产版本的稳定度与成熟度有所提升。

英伟达发言人表示,Blackwell系统具备卓越性能、可靠性与能效表现,已被广泛应用于多种计算场景。包括微软在内的客户已经部署了数十万套GB200与GB300NVL72系统,以满足全球日益增长的AI算力需求。

▲今年9月,微软CEO纳德拉曾称,将建立“世界最强”AI数据中心