至顶网服务器频道 05月08日 新闻消息: 4月26日,浪潮在其合作伙伴大会IPF18上重磅发布全新AI品牌TensorServer,并同时发布业界首款面向AI云设计的弹性GPU服务器NF5468M5,可提供专为AI云优化的弹性配置能力,支持AI模型训练性能最大化或AI在线推理效能最大化,并提供高性能的数据存储与通讯性能,帮助云服务商快速构建强大敏捷的AI基础架构。目前,NF5468M5已在国内领先的大型公有云的AI云服务中得到率先应用。
浪潮IPF18合作伙伴大会上重磅发布全新AI品牌TensorServer
浪潮集团副总裁彭震表示:"浪潮作为全球领先的AI计算力提供者,全新发布的AI品牌TensorServer将致力于成为AI的承载者与赋能者,通过整合创新AI基础架构系统,向用户交付强自适应、高效加速、灵活拓展的AI基础架构系统,持续推动以计算开启可进化的智慧世界。AI云作为一种新兴的云服务形式,已经得到越来越多公有云厂商、AI初创公司及AI用户的共同青睐。NF5468M5正是TensorServer品牌对AI基础架构创新的承诺在AI云场景的最新产品体现。"
AI云对基础架构的设计带来新的挑战,要求AI服务器具备云虚机的GPU资源支持与高效分配、适合于不同AI训练场景的GPU灵活拓扑、AI线上推理的高并发低延迟与高能效比、大规模AI数据的存储与通信能力。
NF5468M5专为AI云场景对弹性配置能力予以优化,增强了PCI-E拓扑和数量配比的弹性,适配多种框架的运算需求,并增加了易于管理和维护的远程GPU拓扑重构技术。NF5468M5可灵活支持AI模型的线下训练和线上推理两类场景,能够让AI模型训练性能最大化或AI在线推理效能最大化。NF5468M5面向线下训练对性能的需求,可支持8颗最高性能的Tesla Volta GPU以PCI-E或NVLink的高速互联;面向在线推理对高能效比的需求,可支持16颗高能效比的Tesla P4 GPU,适用于语音、图片、视频场景。在智能视频分析场景下,可同时处理300路以上1080p高清视频结构化。NF5468M5同时实现了数据存储与通讯性能极大化,消除IO瓶颈,可支持288TB大容量存储或32TB固态存储,实现高达400Gbps通信带宽和1us的超低延迟。
NF5468M5的发布凸显出浪潮在AI计算平台上的创新能力。此前,浪潮已经相继推出多款创新的AI计算平台,包括全球首款在2U空间内高速互联集成8颗最高性能GPU的AI服务器AGX-2、单机可实现支持16个GPU的超大扩展性节点SR-AI整机柜、率先实现协处理器与CPU计算资源的解耦和重构的AI扩展模块GX-4。目前,浪潮已建立全球领先的AI计算产品系列,适合线下训练的计算加速节点采用浪潮领先业界设计的浮点运算能力强、高扩展的GPU服务器,或KNM 计算加速器,而用于线上识别的计算加速节点采用浪潮低功耗、高能效比的GPU服务器,或者低功耗定制优化推理程序的FPGA加速器。
浪潮全新AI品牌TensorServer将整合提供高性能的AI计算平台、管理套件、框架优化和应用加速,为行业AI转型提供赋能支撑。除完善的AI计算产品外,浪潮TensorServer还可提供包括TensorFlow、Caffe-MPI、CNTK 等浪潮专家优化过的深度学习框架,而AIStation 管理平台可对深度学习框架提供任务管理、登录接口、参数调优等服务,并对节点和计算加速部件进行状态监控和调度等。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。