至顶网服务器频道 05月08日 新闻消息: 4月26日,浪潮在其合作伙伴大会IPF18上重磅发布全新AI品牌TensorServer,并同时发布业界首款面向AI云设计的弹性GPU服务器NF5468M5,可提供专为AI云优化的弹性配置能力,支持AI模型训练性能最大化或AI在线推理效能最大化,并提供高性能的数据存储与通讯性能,帮助云服务商快速构建强大敏捷的AI基础架构。目前,NF5468M5已在国内领先的大型公有云的AI云服务中得到率先应用。
浪潮IPF18合作伙伴大会上重磅发布全新AI品牌TensorServer
浪潮集团副总裁彭震表示:"浪潮作为全球领先的AI计算力提供者,全新发布的AI品牌TensorServer将致力于成为AI的承载者与赋能者,通过整合创新AI基础架构系统,向用户交付强自适应、高效加速、灵活拓展的AI基础架构系统,持续推动以计算开启可进化的智慧世界。AI云作为一种新兴的云服务形式,已经得到越来越多公有云厂商、AI初创公司及AI用户的共同青睐。NF5468M5正是TensorServer品牌对AI基础架构创新的承诺在AI云场景的最新产品体现。"
AI云对基础架构的设计带来新的挑战,要求AI服务器具备云虚机的GPU资源支持与高效分配、适合于不同AI训练场景的GPU灵活拓扑、AI线上推理的高并发低延迟与高能效比、大规模AI数据的存储与通信能力。
NF5468M5专为AI云场景对弹性配置能力予以优化,增强了PCI-E拓扑和数量配比的弹性,适配多种框架的运算需求,并增加了易于管理和维护的远程GPU拓扑重构技术。NF5468M5可灵活支持AI模型的线下训练和线上推理两类场景,能够让AI模型训练性能最大化或AI在线推理效能最大化。NF5468M5面向线下训练对性能的需求,可支持8颗最高性能的Tesla Volta GPU以PCI-E或NVLink的高速互联;面向在线推理对高能效比的需求,可支持16颗高能效比的Tesla P4 GPU,适用于语音、图片、视频场景。在智能视频分析场景下,可同时处理300路以上1080p高清视频结构化。NF5468M5同时实现了数据存储与通讯性能极大化,消除IO瓶颈,可支持288TB大容量存储或32TB固态存储,实现高达400Gbps通信带宽和1us的超低延迟。
NF5468M5的发布凸显出浪潮在AI计算平台上的创新能力。此前,浪潮已经相继推出多款创新的AI计算平台,包括全球首款在2U空间内高速互联集成8颗最高性能GPU的AI服务器AGX-2、单机可实现支持16个GPU的超大扩展性节点SR-AI整机柜、率先实现协处理器与CPU计算资源的解耦和重构的AI扩展模块GX-4。目前,浪潮已建立全球领先的AI计算产品系列,适合线下训练的计算加速节点采用浪潮领先业界设计的浮点运算能力强、高扩展的GPU服务器,或KNM 计算加速器,而用于线上识别的计算加速节点采用浪潮低功耗、高能效比的GPU服务器,或者低功耗定制优化推理程序的FPGA加速器。
浪潮全新AI品牌TensorServer将整合提供高性能的AI计算平台、管理套件、框架优化和应用加速,为行业AI转型提供赋能支撑。除完善的AI计算产品外,浪潮TensorServer还可提供包括TensorFlow、Caffe-MPI、CNTK 等浪潮专家优化过的深度学习框架,而AIStation 管理平台可对深度学习框架提供任务管理、登录接口、参数调优等服务,并对节点和计算加速部件进行状态监控和调度等。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。