至顶网服务器频道 05月08日 新闻消息: 4月26日,浪潮在其合作伙伴大会IPF18上重磅发布全新AI品牌TensorServer,并同时发布业界首款面向AI云设计的弹性GPU服务器NF5468M5,可提供专为AI云优化的弹性配置能力,支持AI模型训练性能最大化或AI在线推理效能最大化,并提供高性能的数据存储与通讯性能,帮助云服务商快速构建强大敏捷的AI基础架构。目前,NF5468M5已在国内领先的大型公有云的AI云服务中得到率先应用。
浪潮IPF18合作伙伴大会上重磅发布全新AI品牌TensorServer
浪潮集团副总裁彭震表示:"浪潮作为全球领先的AI计算力提供者,全新发布的AI品牌TensorServer将致力于成为AI的承载者与赋能者,通过整合创新AI基础架构系统,向用户交付强自适应、高效加速、灵活拓展的AI基础架构系统,持续推动以计算开启可进化的智慧世界。AI云作为一种新兴的云服务形式,已经得到越来越多公有云厂商、AI初创公司及AI用户的共同青睐。NF5468M5正是TensorServer品牌对AI基础架构创新的承诺在AI云场景的最新产品体现。"
AI云对基础架构的设计带来新的挑战,要求AI服务器具备云虚机的GPU资源支持与高效分配、适合于不同AI训练场景的GPU灵活拓扑、AI线上推理的高并发低延迟与高能效比、大规模AI数据的存储与通信能力。
NF5468M5专为AI云场景对弹性配置能力予以优化,增强了PCI-E拓扑和数量配比的弹性,适配多种框架的运算需求,并增加了易于管理和维护的远程GPU拓扑重构技术。NF5468M5可灵活支持AI模型的线下训练和线上推理两类场景,能够让AI模型训练性能最大化或AI在线推理效能最大化。NF5468M5面向线下训练对性能的需求,可支持8颗最高性能的Tesla Volta GPU以PCI-E或NVLink的高速互联;面向在线推理对高能效比的需求,可支持16颗高能效比的Tesla P4 GPU,适用于语音、图片、视频场景。在智能视频分析场景下,可同时处理300路以上1080p高清视频结构化。NF5468M5同时实现了数据存储与通讯性能极大化,消除IO瓶颈,可支持288TB大容量存储或32TB固态存储,实现高达400Gbps通信带宽和1us的超低延迟。
NF5468M5的发布凸显出浪潮在AI计算平台上的创新能力。此前,浪潮已经相继推出多款创新的AI计算平台,包括全球首款在2U空间内高速互联集成8颗最高性能GPU的AI服务器AGX-2、单机可实现支持16个GPU的超大扩展性节点SR-AI整机柜、率先实现协处理器与CPU计算资源的解耦和重构的AI扩展模块GX-4。目前,浪潮已建立全球领先的AI计算产品系列,适合线下训练的计算加速节点采用浪潮领先业界设计的浮点运算能力强、高扩展的GPU服务器,或KNM 计算加速器,而用于线上识别的计算加速节点采用浪潮低功耗、高能效比的GPU服务器,或者低功耗定制优化推理程序的FPGA加速器。
浪潮全新AI品牌TensorServer将整合提供高性能的AI计算平台、管理套件、框架优化和应用加速,为行业AI转型提供赋能支撑。除完善的AI计算产品外,浪潮TensorServer还可提供包括TensorFlow、Caffe-MPI、CNTK 等浪潮专家优化过的深度学习框架,而AIStation 管理平台可对深度学习框架提供任务管理、登录接口、参数调优等服务,并对节点和计算加速部件进行状态监控和调度等。
好文章,需要你的鼓励
本文评测了六款控制台平铺终端复用器工具。GNU Screen作为老牌工具功能强大但操作复杂,Tmux更现代化但学习曲线陡峭,Byobu为前两者提供友好界面,Zellij用Rust编写界面简洁易用,DVTM追求极简主义,Twin提供类似TurboVision的文本界面环境。每款工具都有各自特点和适用场景。
韩国汉阳大学联合高通AI研究院开发出InfiniPot-V框架,解决了移动设备处理长视频时的内存限制问题。该技术通过时间冗余消除和语义重要性保留两种策略,将存储需求压缩至原来的12%,同时保持高准确性,让手机和AR眼镜也能实时理解超长视频内容。
网络安全公司Snyk宣布收购瑞士人工智能安全研究公司Invariant Labs,收购金额未公开。Invariant Labs从苏黎世联邦理工学院分拆成立,专注于帮助开发者构建安全可靠的AI代理工具和框架。该公司提供Explorer运行时观察仪表板、Gateway轻量级代理、Guardrails策略引擎等产品,并在工具中毒和模型上下文协议漏洞等新兴AI威胁防护方面处于领先地位。此次收购将推进Snyk保护下一代AI原生应用的使命。
纽约大学研究团队通过INT-ACT测试套件全面评估了当前先进的视觉-语言-动作机器人模型,发现了一个普遍存在的"意图-行动差距"问题:机器人能够正确理解任务和识别物体,但在实际动作执行时频频失败。研究还揭示了端到端训练会损害原有语言理解能力,以及多模态挑战下的推理脆弱性,为未来机器人技术发展提供了重要指导。