ZDNet至顶网服务器频道 02月05日 新闻消息:2月4日,中国数据中心领导厂商浪潮在其“整机柜服务器2015年度产品策略发布会”上,正式发布了基于NVIDIA Tesla GPU 加速器的整机柜服务器——SmartRack 协处理加速整机柜服务器,这是一款密集型高度并行计算服务器,主要面向人工智能、深度学习等应用。
通过和全球视觉计算领域的领导者NVIDIA公司紧密合作,浪潮SmartRack 协处理加速整机柜服务器实现了在1U空间里完美部署4个Tesla GPU 加速器,实现“CPU+协处理器”协同计算加速,合理分配计算资源,充分释放计算能力,在并行计算方面有绝佳的表现,以高效、低耗、可靠、智能的特性,满足深度学习和人工智能等应用。此外,该产品还融合了广泛使用的NVIDIA CUDA并行计算平台以及cuDNN GPU加速库,最大效能发挥了GPU的强大处理性能,另外还能够完美支持Caffe、Torch等业界广泛使用的深度学习计算框架。
NVIDIA Tesla加速计算平台是加速大数据分析与科学计算的领先平台。 该平台把全球最快的 GPU 加速器与广泛使用的 CUDA并行计算模型结合在一起, 凭借先进的系统管理特性、加速的通信技术以及流行基础架构管理软件的支持,可为高性能计算专业人士提供所需的工具,使其能够在数据中心轻松地打造、测试和部署加速的应用。
目前,GPU 加速器已经在高性能计算和超级计算行业中成为主流,而深度学习、人工智能领域则是GPU充分发挥优势的又一热点方向。凭借Tesla GPU 突破性的性能和更大的内存容量,企业用户可以快速地处理大数据分析应用所产生的海量数据,数据科学家利用Tesla加速器可以轻松处理多达拍字节 (Petabytes) 的数据,而且速度比使用 CPU 时快 10 倍。 对计算科学家来说,Tesla 加速器可提供所需的处理动力,能够以前所未有的速度运行更大型的模拟。
浪潮作为中国最早推出整机柜服务器的厂商,其在中国整机柜服务器市场一直保持市场领先。目前,SmartRack整机柜服务器已经迭代到第四代,并在百度、阿里巴巴等实现大规模批量部署,市场占有率超过60%。
IDC数据显示,2010年到2014年,中国市场传统型X86服务器的年复合增长率达17.5%,而整机柜服务器产品的复合增长率则高达58.8%。IDC预测,未来四年整机柜服务器在X86服务器的总体占比将进一步提升,并保持两位数的高速增长势头,而同为密集型产品的刀片服务器,其增长势头将维持在个位数。不难看出,整机柜服务器已经表现出取代传统机架服务器、传统刀片的强大潜质,将成为未来数据中心基础架构的核心形态。
现在互联网公司越来越青睐整机柜服务器。 据透露,2014年百度采购的整机柜服务器占服务器采购总量的30%,到2015年,百度计划将这一比例提升到40%。而阿里巴巴在2014年采购的整机柜服务器占总体采购量20%左右,2015年之后,阿里计划全面采购整机柜服务器。随着面向应用定制的SmartRack整机柜产品在互联网市场的良好表现,NVIDIA GPU将在加速大数据分析与科学计算、大幅降低能耗、采购和运维IT开支方面充分体现自己的优势。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。