对于Supermicro的总裁兼CEO梁见后而言,“We Keep IT Green”的理念早已根植于心,并深深贯彻在Supermicro的企业文化之中。
2004年,一部名为《The Day After Tomorrow》的电影进一步加深梁见后对环境保护的紧迫感。这一年开始,Supermicro开始专心做节能减碳的产品线,到2015年梁见后成立The Green Earth Foundation“绿色地球基金会”,再到如今Supermicro 站在为AI时代的重大创新进行“绿色赋能”潮头。“We Keep IT Green”的“绿色信仰”一直贯穿着Supermicro的整体业务和技术战略,更是成为了Supermicro ESG战略的关键词。
绿色计算是Supermicro整体企业ESG战略和可持续发展目标的核心组成部分。面对人工智能、大型语言模型(LLMs)和高性能计算(HPC)快速发展的当下,计算基础设施的冷却解决方案成为用户必须关注的重点。
梁见后深知,IT基础设施在全球电力消耗中占有相当比例,也是碳排放的重要来源,尤其是在AI时代来临后大量数据带来的高能耗背景下。所以,引领行业可持续高性能计算解决方案,支持业务和环保便成为了Supermicro如今的目标和首要任务
如今,绿色计算的理念已融入Supermicro的设备运营实践中。通过优化电力传输和使用共享基础设施组件,Supermicro致力于降低设备运营成本并提高能源效率。这包括使用共享电源和风扇的多节点和刀片服务器,从而降低整体功耗并提高冷却效率。通过共享风扇和电源,Supermicro的产品可以减少约10%的电力消耗。此外,通过采用液冷技术,Supermicro旨在显著降低高性能计算(HPC)和人工智能(AI)工作负载场景下的冷却运营能耗。
创新——让AI代的数据中心“能效高、性能强、更经济”
Supermicro的绿色计算创新,体现在其产品与设计层面的不断突破,专注于开发满足现代数据中心需求的节能产品,特别是针对人工智能(AI)和其他高性能应用的需求。
一直以来,液冷技术以其高效的能耗控制而备受青睐,尤其适用于那些配置密集、功耗高的系统负载。Supermicro 的液冷技术液冷解决方案能够大幅降低能耗,其直抵芯片的冷却和浸没式冷却,得益于液体比空气具有更优秀的热传递性能,可显著降低了冷却IT设备所需的能耗,有潜力将数据中心的能耗降低高达40%,且成本仅为传统风冷系统的十分之一,是AI、机器学习和大规模数据处理等高性能计算需求的理想选择。
Supermicro 的液冷机架系统,利用负责管理冷却液循环高效的冷却液分配单元(CDU),有效地从密集部署的服务器中移除热量,不仅显著提升了电源使用效率(PUE),更能通过降低冷却相关的能源消耗,大幅减少总体拥有成本(TCO)。针对AI负载,Supermicro 还提供了预配置的机架级人工智能(AI)解决方案,以优化性能、持多种电源配置(如208、230、415或480VAC)以及集成的48VDC设施,进一步提升了数据中心的运行效率。
Supermicro市场营销和网络安全高级副总裁Michael McNerney直言道:“Supermicro的液冷解决方案在我们致力于绿色计算的过程中发挥了关键作用,使数据中心能够在保持高性能的同时更加可持续性地运行。”
同样的,Supermicro 数据中心的液冷配置设计几乎免费,并能持续降低用电量,这也是Supermicro提供的额外价值。
这也回应了在COMPUTEX期间,梁见后问出的那句话——“你相信液冷会比气冷便宜吗?”
Supermicro市场营销和网络安全高级副总裁 Michael McNerney
然而,尽管液冷解决方案在许多尖端应用中已成为首选,但在特定场合,风冷解决方案仍旧是最合适的选择。一般而言,风冷技术通常应用于需要中等冷却能力的通用服务器,适用于小型数据中心或拥有标准IT基础设施的环境。且风冷系统部署的时间更短,适合对部署速度有严格要求的场景。
Michael McNerney介绍说:“在2024年台北国际电脑展(COMPUTEX 2024)上,Supermicro推出的SuperCluster产品,提供了液冷和风冷两种选择,让客户可以根据自己的业务需求选择最合适的技术路径。同时,凭借进一步缩小风冷和液冷之间的部署时间成本差异,Supermicro 最新推出的液体冷却整体解决方案将成为颠覆行业的一大革新。”
Supermicro不仅发力数据中心、服务器阵列能效优化,同样重视单个服务器内部的硬、软件效率。
为了优化系统级能效,Supermicro通过同步匹配工作负载与 CPU 和 GPU 的设计演进,显著降低了运行应用时的能耗。随着每代 CPU 和 GPU 性能的显著提升,Supermicro 的最新服务器能够在功率性能上达到前代产品的3倍。这不仅极大地增强了数据中心在相同或更低电力需求下的服务能力,还通过优化特定工作负载的服务器配置和采用多节点及刀片服务器设计,进一步提升了能源效率。此外,这些服务器的设计支持易于升级的内部组件(可兼容各种 CPU 和 GPU),有效减少了因服务器报废产生的电子垃圾。
“为加快实现全球可持续发展目标,践行最大限度减少环境足迹的承诺。我们力求通过分解式服务器设计尽可能利用可再生能源以减少电子废弃物。”Michael McNerney如是说。
携手——推进绿色计算倡议 打造AI时代的高效基础设施
Supermicro为致力于减少能耗和提升单位能耗下的性能,不断与NVIDIA、AMD、Intel、Red Hat等行业翘楚携手,共同推进绿色计算倡议。“在集成配备先进的冷却技术后,设备温控对于在不过度消耗能源的情况下保持性能至关重要。”Michael McNerney直言道。
为了兼顾高性能和高能效,Supermicro的解决方案选用了Intel Xeon®系列、AMD EPYC™处理器以及NVIDIA的RTX A6000和HGX H100 GPU等先进的处理器和GPU。同时,为了能够让用户根据实际需求随时调整计算资源,Supermicro服务器的可扩展性,能够让用户根据具体任务,以灵活的配置方式更高效地分配资源,并减少不必要的能源消耗。
“与AMD和Intel的合作使得Supermicro能够整合适配先进冷却解决方案的高性能处理器,进一步推动数据中心的能效优化。”Michael McNerney特别强调,将最新的GPU技术和AI框架融入Supermicro的系统中,是优化性能和降低能耗的关键,为此Supermicro与NVIDIA的紧密协作。
这其中,对NVIDIA AI Enterprise 的支持,显著增强了 Supermicro SuperCluster 的性能,用于部署和管理人工智能应用程序,专门针对LLM训练、深度学习以及大规模与大批量推理优化。
关键是,Supermicro的SuperCluster支持NVIDIA AI Enterprise,其中包括NVIDIA NIM微服务和NVIDIA NeMo平台,能实现端对端生成式AI定制,并针对NVIDIA Quantum-2 InfiniBand以及具有每GPU 400Gb/s网速的新型NVIDIA Spectrum-X以太网络平台优化,可扩展到具有数万个GPU的大型计算丛集。
NVIDIA AI Enterprise 涵盖开发、管理和部署 AI 模型所需的所有必要工具,确保了 Supermicro SuperCluster 能够配备一个全面且安全的 AI 解决方案。通过NVIDIA AI Enterprise 的NVIDIA NIM 微服务简化了AI 应用程序从初步开发到全面生产的扩展过程,有效避免了基础设施复杂性带来的常见问题。NVIDIA AI Enterprise 的NVIDIA NeMo 平台支持通过数据管理、进阶自定义以及检索增强生成(Retrieval-Augmented Generation,RAG)技术,开发定制的企业级模型,进一步推动企业解决方案的发展和优化。
在亚太市场, Supermicro已经采取战略举措和相关布局,以满足市场对先进计算能力日益增长的需求。 Michael McNerney介绍说:“Supermicro NVIDIA HGX B200 SuperCluster液冷优化解决方案,专为大型语言模型训练和推理任务而设计。这种解决方案特别适用于专注于生成式人工智能和深度学习应用的企业和研究机构。此外,这些举措使亚太地区的企业能够建设可扩展的、高性能的AI基础设施,满足现代AI应用的需求。”
如今,Supermicro的技术发展路径愈发清晰——计划通过融合尖端的冷却技术,打造出卓越的机架级系统,以迎接日益增长的市场需求。这不仅仅是技术革新的展示,更是与行业巨头携手共进的战略举措,共同推动AI基础设施的高效运转。预计,在不久的将来,全新的将液冷方案在数据中心中的市场份额提升至15%。
AI时代,节能与环保是人类共同的责任与挑战,Supermicro一直践行着承诺,正如梁见后所言“Supermicro立志走在前面,携手迈向一个更加绿色的未来。”
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。