根据Gartner数据,2018年一季度,全球服务器销售额是152.5亿美元,同比增量为40亿美元,云服务器销售额达到20.8亿美元,在整体市场的增长贡献为51.7%。也就是说,在本季度全球市场容量每增长100美元,就有51.7美元来自云服务器。多节点云服务器在全球增长中扮演了主要角色,已经成为云时代服务器创新的主要形态。
Gartner对未来趋势的预测也肯定了云服务器的增长,云服务器正在取代传统机架服务器成为主流,预计在2022年,北美市场多节点云服务器的占比将接近50%。
2018Q1浪潮多节点云服务器全球第一
云计算变革驱动数据中心技术生态全面创新
以云计算、大数据、移动互联网、智能终端、物联网为代表的新一代信息技术普及速度不断加快。我们熟知的所有互联网应用如电子支付、电子商务、共享经济,这些互联网服务背后都是云数据中心在做支撑。
云数据中心领域变革包含两大方向--软件定义与硬件重构,软件定义技术推动了网络、存储和计算三类传统设备的融合,实现了数据中心模块的归一化,硬件重构则是从服务器设备到机柜和数据中心层面的重构,包括服务器形态的创新、数据中心基础架构的创新等,高密度服务器、整机柜服务器、模块化数据中心等都是硬件重构的成果。
云数据中心层面的挑战主要是由规模带来的成本、灵活性、投资回报等问题。智能终端数量的膨胀客观上需要越来越多服务器来支持,但是并不意味着数据中心的数量会增长,提高规模是数据中心获得更好投资回报的前提。另外,大规模数据中心相关技术方案日渐成熟,运营商业务的创新也日渐加速,成为数据中心变革的主要动力,例如发展人工智能、视频直播、大数据等实际应用的高效能专属平台,这个方向的创新正在将硬件重构引向深入。
云服务器正是浪潮面向大规模互联网数据中心和云数据中心应用场景重新定义的新型服务器,具有高密度、高弹性,节能、易扩展等特性。它有别于传统服务器架构设计,实现了从二维平面交换到三维池化互联的架构变革。形态通常为多节点机架、多节点整机柜,计算、存储、供电、散热等功能单元高度模块化、池化,在部署密度、能效、投资回报等方面都明显优于传统服务器。
产业转型,需求驱动的垂直分工产业链
计算机产业一直在变革之中,大型机时代形成了水平产业分工模式,从小型机到X86服务器产业逐渐从水平分工模式转变为垂直分工模式。
与原先不同,以前的产业模式其实一直把用户排除在外,计算机一直沿着计算性能更高、存储容量更大、网络吞吐更快的方向发展,以最上游的处理器创新和操作系统创新带动整个软硬件产业的创新,在PC领域的W-Intel模式最为典型。然而,云计算时代,这种以摩尔定律创新的模式遇到了难以逾越的障碍,一方面,由于制程、主频等方面的限制,Intel处理器的性能提升碰到了瓶颈,Tick-Tock策略被放弃,而另一方面,以CSP为代表的用户采购规模越来越大,业务创新也不断加速,标准化的计算产品已经满足不了他们的需求。
因而,垂直分工模式虽然没有改变,但是这种模式正在从上游技术创新驱动向客户需求驱动转变,产业链驱动力的改变对传统服务器企业的冲击是最直接的,服务器厂商需要从原来的标准化研发生产向定制化的研发生产转变。
云服务器需要新的产业模式
随着大规模数据中心的发展,许多大型的CSP客户都提出了根据业务的需求、业务的变化来定制服务器的要求,这对于服务器的研发和交付提出了敏捷开发、敏捷制造和敏捷供应交付的新需求。在这个变化过程中,浪潮形成了不同于OEM、ODM的JDM业务模式(联合开发,Joint Design Manufacture)。这种业务模式基于双方产业链的融合,为客户提供从研发、生产、供货到实施运维等全业务链条的定制化服务,能够最大程度提高云数据中心的灵活性,提高云数据中心投资回报率。
浪潮针对云计算运营商和其他大规模数据中心用户的JDM获得了中国、北美等地区CSP用户的认可,目前全球市值 TOP10云计算运营商有5家与浪潮建立了稳定的合作关系,在中国市场,浪潮连续4年保持互联网行业市场份额第一。浪潮集团副总裁彭震说,JDM模式能够帮助运营商有效的提高数据中心业务的灵活性,并实现理想的TCO和投资回报。
浪潮JDM模式有效的帮助了运营商用户的业务创新和成长。2017年,浪潮与百度联合开发成功面向超大规模AI线下训练的专用系统SR-AI整机柜服务器,支持16个GPU的I/O Box,可实现4个BOX 64块GPU的级联,峰值处理能力达到为512TFlops,GPU 间I/O延迟降低到纳秒级别。该方案在百度无人驾驶、图片搜索等业务中取得了良好的应用成效。
数字化转型下的传统企业基础架构云化创新
从企业市场看,传统企业数字化转型为IT基础设施的需求带来了新的增长空间,在这个过程中,从互联网行业凝练出来的业务方法论和创新成果在通信、金融、交通等行业也得到了广泛应用。尤其是在工业互联网这个大趋势下,以互联网的经验赋能传统行业,推动传统行业转型升级,为IT厂商提供了非常大的增长空间。
出于转型的需求,企业用户为构建集约和敏捷的IT基础架构,需要将原有的IT架构进行云化革新,各个厂商在面对传统用户时,也需要开发创新的产品和方案。创新更快、更有效的服务器企业也有效的扩大了自己的市场份额。浪潮将为云计算运营商开发的产品技术移植到企业和政府用户中,形成了一个完整的新产品线--融合架构,包括整机柜、机架和刀片等多种形态,覆盖了大中小等不同规模的用户,在中国移动、12306以及各地政务云中广泛应用。
这就意味着,云服务器不仅要充分满足传统意义上的云计算(IT基础设施)需求,更要融合人工智能、高性能计算、物联网乃至边缘计算等领域的计算架构、计算理念和计算需求,才能更好的满足未来云计算与其他技术交叉融合发展的趋势。在此情况下,深刻理解客户需求,创新能力领先的厂商将会在未来的竞争中胜出。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。