至顶网服务器频道 12月21日 新闻消息(文/李祥敬):随着云计算的深入发展,企业对于云端计算能力的需要呈现多样化的趋势,这就要求云计算提供商能够根据用户的需求提供多样化的产品和服务。近日,华为云正式发布了针对通用计算、异构计算、专属计算三类场景的六款实例,满足更多更广客户的云端应用需求。如果你以为这次华为云只是简单地发布新品,那就大错特错了。为什么这样说呢?因为在这些新品背后是华为在硬件技术上的深入研发。
华为云硬件首席架构师余洲
华为云硬件首席架构师余洲告诉记者,对于云计算来说,客户是感知不到背后的硬件的,但是在这背后离不开厂商在硬件方面的研发投入,特别是定制化工作。通过软硬结合可以实现云服务价值的最大化。
据余洲介绍,2007年、2008年,华为就开始为互联网客户提供定制化的服务器,并针对互联网类业务的特点进行硬件定制化。到2012年,我们发现业内的很多标准化芯片已经无法满足云计算、互联网这些业务的要求。截止到目前,华为针对数据中心的芯片发货数量已经达到了190万片。“这些芯片支撑着华为云计算的业务。”
企业上云后对背后的IT系统要求更高,特别是可靠性、安全性、极致的性能。而目不管是CPU还是内存或者存储设备,单个组件的性能没办法提升的情况下,就需要考虑新的方法,使整个数据中心的摩尔定律能够继续延续。
“在云数据中心硬件定制化方面,我们现在的做法是把减法变成加法,也就是把部件系统组合到一起,重新思考,最终带给我们更强大的算力,使公有云系统能够更好地满足业务的需求。为此,华为打造了业务驱动的基础设施架构(SDI)。”余洲说,“不管是计算、存储、网络,我们的理念是让工作负载跑在最合适的硬件上面。这些优化后的硬件组合在一起,形成相比于原来更强大的计算力,保证多样化的应用能够在华为公有云上得到最好的体验。”
例如在SDI中,华为让x86处理器尽可能为客户的应用服务,其他的一些支撑性能力和基础能力比如网络转发和存储管理,华为采用专门的芯片来承载。这样的话,综合起来,它会获得更好的用户体验。同时也更简化了客户在使用华为云上的管理成本,因为在这个过程中,华为专用的芯片会把网络处理、虚拟网络接口和共享存储的接口、管理、安全这方面的能力都处理好。
余洲表示,从最底层的芯片以及和英特尔深度定制多款处理器,到华为针对一些网络、存储和互联方面的芯片,更多的芯片还在开发中。“我们一直在不断努力,希望打造更好的体验给我们的客户。“
基于综合性能以及价格等因素考虑,云上超过90%的业务都会选择通用计算产品,这也对云基础服务提供商的通用计算产品提出了很大的挑战。此次华为云发布的通用计算三款实例,旨在进一步提高云端应用场景中的计算性能,为客户带来更高、更快、更稳的通用计算能力。
在高性能计算场景中,华为云第三代高性能计算型实例H3,搭载华为云优化的Elastic vSwitch,网络转发性能高达500万PPS,支持AVX 512,HPC场景性能相比上一代提高20%以上;第三代超高IO型I3,高达350W IOPS,采用自研智能网卡,主打高性能数据库应用,让数据读写更快速;第三代通用计算增强型C3,搭配全新 V5 CPU,较上一代性能提升60%以上。
华为云全新的第三代通用计算实例H3、I3、C3,采用标准的CPU架构,搭载定制的Intel Skylake V5 CPU,整型计算性能相比行业同类产品提升15.95%,浮点型计算性能提升15.01%。此次发布的第三代计算实例,搭配使用华为自研海思芯片的智能网卡,可以为客户提供最高50Gbps的超高带宽和超低时延网络,并且单盘80万IOPS,88μs读响应,1TB/min快速安全擦除等全新的高性能计算体验。
人工智能技术的发展全面激发了企业对于异构计算的需求,此次华为云发布的异构计算实例PI1,P2,基于华为自研的Atlas智能计算平台,是专用于深度学习DL训练以及推理的两款异构计算实例。
AI推理优化专用实例PI1,GPU卡P4能够同时进行35路高清视频流实时转码与推理,并且程序时延降低15倍以上,能够将AI推理业务的能力发挥到极致;AI超强训练计算实例P2,搭载GPU卡V100,比P100在AI训练领域性能提高3倍多,同时搭载华为自研NVMe SSD实现超高IOPS的存储性能,避免短板效应,使得P2实例在AI训练方面,性能实现卓越表现。
在异构计算创新方面,余洲介绍到,华为创新了动态拓扑能力。GPU有非常广泛的应用场景,包括高性能计算、深度学习等。在多个GPU的时候,连接不同的CPU有不同的拓扑接法,把所有的GPU接在一个CPU上,可以分散在不同的CPU之间。针对深度学习的场景,最佳的连接拓扑方式是把多个GPU接到同一个CPU上,这样让GPU之间的通信不用跨越两个CPU之间一致性的接口。
相反对于其他的应用比如HPC,它可能更希望GPU比较均匀地分布在多个CPU上,可以用CPU和GPU协同一起在进行运算,这样可以把多个CPU的能力都充分发挥出来。“在异构计算平台里,华为所做的工作就是支持动态拓扑能力,可以让我们的客户能够以最佳拓扑来适配工作负载,经过我们的实验,动态拓扑比通用拓扑带来20%的性能提升。”余洲说。
现在企业把越多越多的关键业务计算放到云端,针对企业在SAP HANA、Oracle RAC或者高性能计算HPC等场景的核心需求,此次华为云还发布了专属计算行业旗舰级产品BMS计算实例KunLun 9016。
众所周知,KunLun 9016采用华为自研的创新CPU高速互联和RAS2.0可靠性增强技术,带有16个处理器单元,每个处理器带有24核CPU,总共384核物理CPU以及16T的超大内存,搭配自研SSD全闪存本地存储,相比企业型标准规格性能提升了3倍。同时可以提供主动故障分析,核心部件在线更换,16路CPU高速互联,硬分区技术以及5分钟快速发放等强大功能。
依托稳定可靠、极致性能、开放生态,华为云把KunLun服务器的关键业务计算能力“搬到”云端,从而更好地满足企业关键业务上云的需求。
华为云计算架构师罗浩
华为云计算架构师罗浩表示,华为专属云叫做DeC,给客户提供云上“头等舱”的体验。这种"头等舱"体验体现在三个方面:空间的专属;定制的套餐;专属的服务。此外,华为专属云DeC提供了算力专属和数据专属。“依托SDI智能网卡,华为云BMS解决了传统关键业务应用(如Oracle RAC)要求必须采用共享存储机制来确保应用高可用性问题。华为云可以帮助企业关键应用能够更好地在云端运行。”
华为云IaaS计算域总监鲍亮
华为云IaaS计算域总监鲍亮表示,云计算是一个系统、复杂的工程,各个层面相互配合,软硬结合,不断积累才能够构建出稳定、可靠、高速、安全的云计算基础设施。“如何能够给客户交付好的产品,为客户寻求最佳的解决方案,是我们一直坚守的信念。”
截至2017年6月,华为云计算服务于全球142个国家和地区超过3500家客户,覆盖政府及公共事业、运营商、能源、金融、制造、媒资、医疗、教育等个行业,满足200多种应用场景,华为在全球部署的虚拟机规模超过240万台。“这些年来,我们在线下积累的经验,让我们在公有云市场快速的成长。华为云仅仅用了半年的时间就完成了整个中国区域的布局,并且截止到2017年上半年,我们同时完成了德国、法国以及拉美区域的公有云布局,初步形成了整个华为云的全球一张网。”鲍亮说。”
鲍亮最后表示,怀匠心、践匠行,做匠人,华为在“硬专快稳”四个方面,从“芯”打造服务器,实现数据中心层面的摩尔定律,为客户提供稳定、可靠、性能好的云底座和平台。“虽然现在的华为云可能不是最好的,但是我们相信一定是进步最快的,我们希望进步最快的华为云能够遇见最好的你。”
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
研究表明,现有的公开 AI 模型在描述大屠杀历史时过于简单化,无法呈现其复杂性和细微之处。研究人员呼吁各相关机构数字化资料和专业知识,以改善 AI 对这段历史的理解和表述。他们强调需要在 AI 系统中加入更多高质量的数据,同时在审查和信息获取之间寻求平衡。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。