为企业级运算、储存、网络解决方案和绿色计算技术等领域的Super Micro Computer, Inc. (SMCI) ,近日宣布扩大最广泛的人工智能(AI)GPU服务器产品组合,此系列整合了最新的NVIDIA Ampere系列GPU,包括NVIDIA A100、A30和A2。
Supermicro最新的NVIDIA认证系统的AI性能是前几代产品的高十倍,确保支持AI的应用程序,如图像分类、物体检测、强化学习、推荐、自然语言处理(NLP)、自动语音识别(ASR),能大幅降低成本,更快得到深入洞察。除了推理,Supermicro高效能的A100 HGX 8-GPU和4-GPU服务器相比于前几代系统,在大数据分析方面提高了三倍AI训练速度和八倍性能。
Supermicro总裁暨首席执行官Charles Liang表示:“Supermicro以广泛的系统组合持续引领GPU市場,针对从边缘到云端的任何工作负载进行优化。我们针对云游戏的整体解决方案在一个2U 2节点系统中提供多达12个单宽度GPU,实现了卓越的密度和效率。此外,Supermicro还推出了新的通用GPU平台,將所有主要的CPU、GPU,以及结构和散热解决方案整合在一起。”
Supermicro E-403服务器是分布式AI推理应用的理想选择,适用于如交通控制和办公大楼环境等。Supermicro Hyper-E边缘服务器通过每个系统有多达三个A100 GPU为边缘应用带来了前所未有的推理能力。Supermicro現在提供完整的IT解決方案,可加速工程和设计专业人员之间的协作,其中包含了NVIDIA认证的服务器、储存装置、网络交换机以及用于专业级可视化和协作的NVIDIA Enterprise Omniverse软件。
NVIDIA加速计算部总经理兼副总裁Ian Buck表示:“ Supermicro广泛的NVIDIA认证系统由采用NVIDIA Ampere架构的完整GPU产品组合提供支持。Supermicro的客户可从中获得卓越效能,应用于各种类型的现代化AI工作流程——从边缘的推理,到云端的高效能运算,还有两者之间的一切应用。”
Supermicro效能强大的数据中心2U和4U GPU(Redstone、Delta)系统将率先上市,支持新的Quantum-2 InfiniBand产品系列和BlueField DPU。NVIDIA Quantum-2 InfiniBand解决方案包括高带宽、超低延迟适配器、交换机和电缆,以及能为数据中心带来高效能的完整软件,该解决方案运行于整个Supermicro产品系列。
与上一代InfiniBand通讯适配器和交换机相比,采用Quantum-2 InfiniBand的系统提供400 Gb/s的传输速率、每端口高2倍的带宽、更高的交换器密度,和每交换机高32倍的AI加速,并且能同时支持Intel或AMD处理器。
随着混合式工作环境成为常态,产业需要新技术来确保人力的技术平等。NVIDIA的Omniverse Enterprise和Supermicro GPU服务器的组合,将彻底颠覆复杂的3D工作流程,从而带来无限迭代和更快速的创新产品上市时间。此外,NVIDIA的Omniverse Enterprise,以及用于将AI整合到其企业工作流程中的AI Enterprise on VMware已针对Supermicro的NVIDIA认证系统进行了优化和测试,使地理位置分散的团队也能够无缝协作。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。