ZDNet至顶网服务器频道 02月05日 新闻消息:2月4日,中国数据中心领导厂商浪潮在其“整机柜服务器2015年度产品策略发布会”上,正式发布了基于NVIDIA Tesla GPU 加速器的整机柜服务器——SmartRack 协处理加速整机柜服务器,这是一款密集型高度并行计算服务器,主要面向人工智能、深度学习等应用。
通过和全球视觉计算领域的领导者NVIDIA公司紧密合作,浪潮SmartRack 协处理加速整机柜服务器实现了在1U空间里完美部署4个Tesla GPU 加速器,实现“CPU+协处理器”协同计算加速,合理分配计算资源,充分释放计算能力,在并行计算方面有绝佳的表现,以高效、低耗、可靠、智能的特性,满足深度学习和人工智能等应用。此外,该产品还融合了广泛使用的NVIDIA CUDA并行计算平台以及cuDNN GPU加速库,最大效能发挥了GPU的强大处理性能,另外还能够完美支持Caffe、Torch等业界广泛使用的深度学习计算框架。
NVIDIA Tesla加速计算平台是加速大数据分析与科学计算的领先平台。 该平台把全球最快的 GPU 加速器与广泛使用的 CUDA并行计算模型结合在一起, 凭借先进的系统管理特性、加速的通信技术以及流行基础架构管理软件的支持,可为高性能计算专业人士提供所需的工具,使其能够在数据中心轻松地打造、测试和部署加速的应用。
目前,GPU 加速器已经在高性能计算和超级计算行业中成为主流,而深度学习、人工智能领域则是GPU充分发挥优势的又一热点方向。凭借Tesla GPU 突破性的性能和更大的内存容量,企业用户可以快速地处理大数据分析应用所产生的海量数据,数据科学家利用Tesla加速器可以轻松处理多达拍字节 (Petabytes) 的数据,而且速度比使用 CPU 时快 10 倍。 对计算科学家来说,Tesla 加速器可提供所需的处理动力,能够以前所未有的速度运行更大型的模拟。
浪潮作为中国最早推出整机柜服务器的厂商,其在中国整机柜服务器市场一直保持市场领先。目前,SmartRack整机柜服务器已经迭代到第四代,并在百度、阿里巴巴等实现大规模批量部署,市场占有率超过60%。
IDC数据显示,2010年到2014年,中国市场传统型X86服务器的年复合增长率达17.5%,而整机柜服务器产品的复合增长率则高达58.8%。IDC预测,未来四年整机柜服务器在X86服务器的总体占比将进一步提升,并保持两位数的高速增长势头,而同为密集型产品的刀片服务器,其增长势头将维持在个位数。不难看出,整机柜服务器已经表现出取代传统机架服务器、传统刀片的强大潜质,将成为未来数据中心基础架构的核心形态。
现在互联网公司越来越青睐整机柜服务器。 据透露,2014年百度采购的整机柜服务器占服务器采购总量的30%,到2015年,百度计划将这一比例提升到40%。而阿里巴巴在2014年采购的整机柜服务器占总体采购量20%左右,2015年之后,阿里计划全面采购整机柜服务器。随着面向应用定制的SmartRack整机柜产品在互联网市场的良好表现,NVIDIA GPU将在加速大数据分析与科学计算、大幅降低能耗、采购和运维IT开支方面充分体现自己的优势。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。