2020年伴随着数字化实践的深入,人们的生活与工作发生了巨大的变化。数字化技术正在给各行各业带来巨大的变革,但同时也给作为支撑的云计算基础设施提出更高的需求。
近些年,腾讯云持续加大云基础设施领域的投入和自研创新力度,通过不断丰富和完善的自研产品矩阵,为基础IaaS产品的性能增长以及成本降低提供坚实基础。
其中,腾讯云星星海自研服务器是腾讯真正为云而生的服务器。结合数据中心实际部署环境要求,针对云端的计算、存储、网络等场景做了重点优化。截止至2020年10月,星星海的客户规模增长超过50倍,云上的应用规模增长超过30倍,已成为业内上线后增长最快的服务器产品。
自研的变革之路
为了更好地支撑业务发展,腾讯在数据中心基础设施层面很早就开始了自研之路。腾讯云服务器与供应链管理部总经理刘裕勋告诉记者,作为国内领先的互联网企业,腾讯也在思考从移动互联网到云时代的转变。迎接云时代的浪潮。
由于海量与多样化的业务应用,腾讯对于数据中心基础设施是强需求。在数据中心建设上面,在2016-2017年,腾讯在内部成立了“云拓”项目,开展超大规模数据中心的研究。到目前为止,腾讯在华南、华东、华北的30万台级别超大规模数据中心也已经亮相。
现在不管是智能终端还是网络环境更多复杂,这对于数据的存储、传输、计算等场景带来新的变化。而作为云服务厂商,腾讯云也在思考如何平衡成本与质量两个维度为用户提供相应的服务。
刘裕勋说,当下软硬一体化协同对于整个云基础设施和基础架构的升级迭代至关重要。这也是腾讯进行硬件自研与供应链管理的初衷,为云上客户和开发者提供更具性价比的产品和服务,同时加深了对应产业链的理解。“因为有英特尔这样的优秀合作伙伴,在腾讯云的自研硬件的变革之路提供了非常多的支持,基于英特尔平台打造了高性价比的硬件系统,为整个产业链的升级迭代带来了不一样的视角和新打法。”
腾讯QQ等优秀的互联网业务样本应用已经成功上云,但这个过程并不是一蹴而就的。“微信、QQ等业务迁移到云端的过程是非常痛苦的,因为当时候腾讯云的整体基础架构还是处于初级阶段的。这两年来,腾讯云在自研硬件方面与英特尔这样的合作伙伴在芯片、加速器的软硬一体化协同进行协创新,很好地支撑了整个基础设施的运行效率。”刘裕勋说。
现在腾讯云将自己在基础设施方面的能力进行输出,封装成有竞争力的产品和服务提供给各行各业,加速他们的数字化转型。特别是在今年,像腾讯会议在8天内完成了100万核的扩容,保证了社会快速复工复产。
刘裕勋表示,这样的例子在腾讯非常多,通过自主研发硬件和软件层面的云原生最佳实践有效结合,腾讯云成功应对了高并发复杂的基础架构场景,并与海量、多样性的业务需求输入形成了一个比较良好的互动。“而这离不开像英特尔这样的合作伙伴在底层芯片架构的优化,使得整个产业生态向健康良好的方向发展。腾讯云星星海从0到1,再从1至N将是一个不断扩大的过程,在未来的日子里也将致力于自研硬件的研发。”
协同创新的新阶段
在近日举行的2020腾讯云Techo Park开发者大会期间,搭载即将发布的英特尔至强可扩展处理器(代号“Ice Lake”)的腾讯云星星海新一代自研双路服务器正式发布。该服务器作为云服务的硬件基础,采用英特尔10nm工艺处理器,在核心数、单核性能上较上一代基于英特尔至强可扩展处理器的服务器有大幅提升。
据悉,该款服务器将同此前发布的腾讯云星星海首款自研四路服务器将于本月底正式加入腾讯云产品矩阵,为行业终端客户带来全新升级的使用体验。
英特尔方面表示,公司内部有团队一直专门对接腾讯,针对腾讯的公有云以及各种专有云、行业云,支持腾讯云从底层硬件到全栈软件,包括工作负载等方面的优化。
中国互联网市场引领全球,对应互联网厂商的需求也在不断变化。据英特尔介绍,在最开始的合作阶段,英特尔和腾讯的合作是通过OEM厂商售卖服务器,后来腾讯的需求越来越具体化。在2014年,英特尔与腾讯成立了联合实验室,针对腾讯特有的工作负载和场景做进一步的测试和优化。
2020年9月,双方基于进一步的深化合作,在多样、广度与宽度的背景下将实验室承载的各种创新项目进行了全面升级。
“英特尔提出了XPU战略,不管是CPU还是GPU、AI加速器、FPGA,我们基于联合实验室展开深入合作。我们从每一代定制一款CPU,到每一代现在能定制多款CPU形成一个组合,支撑腾讯云内部和外部多样的场景。同时英特尔在二十多年之后,第一次又发布了独立显卡,腾讯也是我们独立显卡的合作定义方。”英特尔相关人士介绍道。
而上文所说的独立显卡就是近期英特尔发布的首款面向服务器数据中心的独立显卡,代号SG1,正式名称就简单直接地叫“服务器GPU”(Server GPU),专为高密度、低时延的安卓云游戏、流媒体服务而设计。
据英特尔介绍,SG1的第一个应用场景就是安卓的手机云游,并根据腾讯的应用场景针对内存、算力等做了最深度的优化。
其实此次全新星星海自研服务器的发布就是双方合作的最新成果。得益于双方的深度优化定制,腾讯云星星海新一代自研双路服务器具备极具前瞻性的系统架构,在计算密度上的提升高达50%;而通过设计高性能散热器和研发创新独立风道设计,其平台散热能力提升达45%。同时,由于RAS增强功能的引入,以及多维度全覆盖故障诊断、精细化定位问题,使该服务器的整体宕机率降低约50%。
值得一提的是,测试数据显示,与搭载第二代英特尔至强处理器的双路服务器相比,新款服务器的浮点性能提高70%,基于英特尔AVX-512扩展指令集,腾讯云星星海新一代自研双路服务器对应的服务器实例在HPC场景下表现出了极大提升,特别是在生命科学和金融服务等领域表现显著。
此外,通过对第二代英特尔傲腾持久内存的支持,腾讯云星星海自研双路服务器单机最高支持的内存可达12TB,充分满足大型数据库等业务需求。而借助即将发布的第三代英特尔至强可扩展处理器,用户则可以获得更强的计算性能。腾讯云星星海双路服务器免工具模组化设计能够使重要模组部件全系列服务器共用成为现实,覆盖通用计算、异构计算、裸金属、高性能计算等全业务场景,在弹性部署的同时,也能够有效降低云服务总体成本。
在此基础上,新一代处理器也带来了创新的安全技术——英特尔SGX(最大支持1TB enclave)和加密加速技术,不仅有效增强了安全性,还可满足创新云业务的安全需求,从而大幅提升腾讯云计算矩阵的战略能力。
“整个业务场景的变化会转化成对于芯片架构不同特性的需求,我们和英特尔进行了比较好的协同和联动,解决了客户遇到的问题。”刘裕勋说,“定制化只是大家看到的一个表面上的结果,我们和英特尔这么多年的合作,最终的出发点还是根据客户和业务的需求,不断在思考客户和业务到底需要什么?它的需求怎么转换成腾讯云的云基础架构需求。这些云基础架构的需求怎么转换成底层芯片或者整机系统的需求。从这样的一个逻辑思维的角度出发,形成一个比较良性的闭环”
在人工智能等工作负载的推动下,计算的巨大需求正在不断衍生。基于数十年的x86生态系统创新,英特尔致力于为客户提供全球最好的CPU,以及从GPU到AI芯片的全面丰富的产品组合,在人工智能训练、5G网络、图形和自动驾驶等许多领域获得份额。
“我们希望满足各类用户的需求,但是这是不现实。毕竟英特尔的定制化工作需要巨大的时间和成本投入。通常头部CSP拥有海量用户,其实通过头部CSP把用户的场景和工作负载总结出来,结合我们的能力进行定制,就可以满足绝大数的用户需求。”英特尔相关人士表示。
刘裕勋表示,2021年是全新星星海服务器从发布、量产到规模上量的一年。接下来整个星星海的自研硬件会不断拓宽平台的适用性,相关的部件自研等一系列工作也在全栈式展开。
随着万物云化的趋势加速渗透,算力的利用方式正在发生着嬗变,云上成为数据增值、孕育时代机遇的全新沃土。藉此,英特尔与腾讯不断加深具有战略意义的长期合作伙伴关系,持续在硬件设计、软件优化、技术协同创新等方面进行紧密合作,并取得重大成就。
面向未来,英特尔将一如既往,发挥创新实力与平台级优势,坚定推动双方在深度学习、人工智能、云基础架构与安全技术等方面的深入合作,挖掘数据机遇与潜力,点燃千行百业智能化变革的新引擎,为数字经济时代增长提供不竭动力。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。