“上善若水。水善利万物而不争,处众人之所恶,故几于道。居善地,心善渊,与善仁,言善信,政善治,事善能,动善时。夫唯不争,故无尤。”——《老子》第八章
水滋养万物,使万物得其生,万物的生存都离不开水。所以说水于万物功莫大焉,但是水却没有因为自己对于万物莫大的功劳而争居万物之上,反而总流向最低最下处,处于万物最不喜欢的位置上。
“要让产品和解决方案真正落地,触及人们的生活,英特尔有一个秘密武器:那就是生态的打造。水利万物而不争。这是英特尔的生态之道。”英特尔公司市场营销集团副总裁兼中国区总经理王锐也用“水利万物而不争”来诠释英特尔的生态之道。
王锐表示,英特尔30多年在中国经营,打造生态系统,和合作伙伴、客户一起把英特尔的产品打造成实实在在的解决方案,共同优化,从软件和系统方面加强这种实用价值。英特尔的产品拥有广泛的用户,不断帮助英特尔优化这种优势,在实践中验证,经历考验。
目前英特尔的生态系统仍在继续不断更新、扩展和演进。除了长期合作的硬件OEM和操作系统、数据库、虚拟化等软件提供商,在云计算和人工智能技术不断普及的同时,也出现了更多创新性的技术提供商、云服务提供商、行业服务提供商。
英特尔公司行业解决方案集团中国区总经理梁雅莉表示,英特尔的价值包含在我们客户的解决方案之中。作为一家技术产品提供商,英特尔一直在不断推出新的产品和技术,来积极配合客户的数字化需求。把握AI、5G、云、智能边缘的技术趋势,英特尔与长期的生态合作伙伴,包括OEM、ODM、ISV、SI、云服务提供商、终端用户一起,与不同行业的伙伴紧密合作,面向不同的工作负载和实际需求,打造真正能落地的解决方案,从而推动智能在千行百业的绽放和应用。
英特尔客户充分发挥英特尔客户至上的价值观,站在客户的角度,从客户的实际应用需求出发,为客户匹配到最合适且最具性价比的解决方案,并通过与客户一道进行反复的沟通测试,真正验证了英特尔平台级解决方案在真实应用场景中的价值。
云计算篇
越来越多的企业纷纷上云,并通过技术创新实践,降低企业信息化成本,加速数字化转型。与此同时,云计算市场需求的不断增长,不仅对云平台提出更大挑战,对企业IT基础设施的内存、网络、I/O等性能要求也显著提升。
针对云服务提供商合作伙伴,英特尔通过芯片产品为其提供最优化工作负载,这包括了在软件、硬件和部署方面提供定制化的产品和服务。不管是Google、Facebook、Amazon等国际互联网巨头,还是国内的BAT等互联网厂商,他们有自己个性化的需求。英特尔会根据每一个客户的需求,让专门的工程师团队为他们提供软件和硬件上的个性化支持。在基础设施端或者人力支持、软件端,英特尔都可以做定制化的调试和服务。
云服务提供商正在迅速增长,英特尔也非常关注各个不同类型云服务提供商的增长,希望通过合作驱动他们技术和业务的创新。英特尔以数据为中心,从计算、存储、网络、软件等各个层面进行布局,帮助云服务提供商合作伙伴应对新变革。
“从萍水相逢到友达以上”
2020年,青云QingCloud迎来公司成立8周年的关键时刻。8年,对于一家科技公司来说,是一个不断砥砺前行、突破自我的旅程。8年,对于中国云计算市场,是从稚嫩走向成熟,堪当大任的里程碑。在这8年里,青云QingCloud坚持着自己的"云之基石,自由计算"的理念,迈着坚实的步伐,用心中对于云计算事业的无限热爱,书写着中国云计算发展的无限可能。
伴随青云QingCloud的成长,2017年到2020年英特尔一直在大力支持它的业务和技术,还有产品和服务。其实英特尔对CSP整个行业非常重视,2016年底成立的专门的技术和服务团队,支持CSP和中国快速成长的互联网企业。针对CSP的需求,英特尔提供相应的产品和技术服务,并在市场推广层面帮助这些CSP进行商业推广。
英特尔相关负责人表示,CSP本身的发展和业务逻辑是对英特尔产品设计和功能是有帮助的,也是有指导性意义的。在所有新产品发布之前,英特尔都会和CSP客户进行提前的验证,比如第三代英特尔至强可扩展处理器就和CSP厂商提前进行各项技术的验证和测试。英特尔不只是提供产品,而更多是一个合作伙伴。
在2017年之前,青云QingCloud与英特尔的合作交流并不是很多。因为青云QingCloud对技术保持比较开放的态度,比如多元化的算力架构。针对目前市面存在的多元算力架构,英特尔为青云QingCloud提供了多元化的CPU产品,并在技术和商务层面进行支持,双方还进行了技术联合宣传。青云QingCloud进行公有云运营时必须考虑CPU选型,所以测试工作很重要,这一方面与硬件本身有关系,另一方面也跟联合调优有关。经过这几年的双方紧密合作,青云QingCloud和英特尔已经成为非常好的合作伙伴。
青云QingCloud供应链总监廖洋表示,英特尔一个的很大特点是在推出相关产品和技术前会与云服务厂商进行沟通,了解CSP的需求,这样保证产品能够解决用户的业务痛点,双方在技术方案商的默契度也特别高。
同时,英特尔还针对青云QingCloud重新进行了整个流程的梳理和优化,让自己的产品更加贴合青云QingCloud的业务需求。例如现在CSP都在推出云端AI服务,但是这些服务更多是基于GPU架构。英特尔与青云QingCloud的AI工程师一起花了3-4个月的时间,成功上线了基于第二代至强可扩展处理器的AI推理服务,这样让其AI公有云服务更加丰富,让客户有更多选择。
通过这些工作,英特尔让青云QingCloud认识到,英特尔不仅是一个产品部件提供商,更多是一个和客户一起成长的、技术上值得信赖的服务商,从此青云QingCloud坚定地与英特尔走在一起。
在谈及选择供应链合作伙伴的时候,廖洋表示,青云QingCloud一方面看对方的产品是不是有创新点,能不能帮助青云QingCloud实现降低成本和提高服务质量。毕竟产品的稳定性非常重要,因为青云QingCloud依托公有云为企业级客户交付私有云和混合云产品。另一方面,供应链的稳定,包括持续供货能力也是青云QingCloud非常看重的。
“青云QingCloud与众多上游供应商都有合作,但是英特尔给我们的印象最为深刻,从方案提出到真正落地,非常专业和高效。比如在英特尔精选解决方案方面,青云QingCloud与英特尔合作推出了青立方超融合精选解决方案,从产品方案提出到方案的验证,再到实际项目落地,英特尔在青云QingCloud合作厂商里面,绝对是效率最高的。”廖洋说。
“技术的执念”
2020年,对于已成立8年的中立云计算服务商UCloud优刻得来说,八年的奋斗之路见证了中国云计算市场的发展。登陆科创板、成为中国云计算第一股、中国A股市场第一家同股不同权的上市公司,这一系列“第一”让UCloud成为当下云计算市场的特立独行者。而这些离不开UCloud对于技术创新的执念。
UCloud在创业初期,就选择坚持走技术路线,并最终坚持走了下来。三位创始人的技术背景,决定了UCloud这家公司的技术基因,而UCloud在业界的口碑也一直是技术出色。UCloud COO华琨表示,UCloud是一家非常技术导向的公司,研发人员占比超过一半以上,非常看重产品的创新以及研发的深度。
在公有云业务上面,面对成千上万的用户,需要解决算力的调度以及平台性能稳定,包括安全性、成本等。“这是一个非常典型的摩尔定律的应用场景,我们致力于不断让计算、存储、网络的成本降低,把优惠给到我们的用户。”华琨表示说,“公有云是一个规模化的产业,如果想大幅提升增长速度,就需要做到性能更高、成本更低,这当中也有很多UCloud和英特尔合作起来大展拳脚的机会。”
对于目前的公有云市场,UCloud主打中立,这也是根据其自身的特点而提出的差异化的竞争策略。在2018年UCloud用户大会上UCloud首次公开了“中立”的理念。而在2019年,UCloud更加强调做“不和用户竞争的云”。
除此以外,UCloud专注于公有云技术,勤勤恳恳提供产品和服务,满足行业客户对于云计算的复杂需求,这体现了UCloud的技术实力和灵活性。基于此,UCloud在底层技术选择上需要确保可控和极致的性能、成本优化以及透明的架构。所以,UCloud选择英特尔开放架构。
华琨说,对于UCloud而言需要打造比较优势,至少要保持6-12个月的领先,让业界最新的硬件能够以最快的速度商业化推向市场。“我需要以最快的速度保障这个硬件的特性,同时还要有大量的测试,测试它的稳定性。英特尔研发团队的参与可以帮助UCloud的研发工程师基于英特尔的最新技术打造市场领先的产品。”
作为公有云提供商,网络的质量、带宽和利用率是至关重要的。UCloud借助英特尔网卡产品以及DPDK开发工具集、SPDK,打造出非常有性价比的产品而服务于最终用户。除了产品,针对不同类型客户的个性化需求,UCloud通过软件研发使得硬件性能能够得到最大程度的发挥,然后把不同特性的产品推给不同场景的客户。例如游戏用户对网络吞吐要求非常高,UCloud就推出了高包量的产品适配用户需求;电商场景对IO的吞吐要求特别高,UCloud也有相应的产品;针对科研高校对于算力的高要求,UCloud提供了HPC云服务。
从去年下半年开始,UCloud推出了“快杰”产品系列,为了确保性能更快,成本更低,UCloud会每过12个月左右的时间推出新一代的“快杰”产品。在这当中,UCloud和英特尔都有相应的合作,包括x86的新一代CPU,NVMe SSD硬盘、智能网卡以及傲腾内存等等。在产品早期,UCloud和英特尔的团队形成联合的项目组进行新产品的研发工作。最终经过双方的合作,新一代的“快杰”产品计算性能提升了16%,网络性能内网达到了1000万PPS,外网也是万兆的带宽,存储达到了120万IOPS。
最终,UCloud以技术创新,发挥硬件和软件的研发实力,在英特尔提供的硬件产品上面进行创新性的应用场景的探索和实现,为客户提供更高性价比的产品。“随着新基建的推进,UCloud不断探索新的业务场景,比如云游戏、云手机、云电脑,并在自建数据中心等方面积极布局。我们希望和英特尔在计算、存储、网络等方面,构建一个能够满足行业数字化转型需求的混合云解决方案,更好地支撑新型基础设施建设。”华琨如是说。
超算篇
超级计算机拥有极快的运算速度,可以应用于多种尖端科技行业,比如各种实验模拟(包括核爆炸模拟)、天文物理计算、天气预测、人工智能推演、弹道计算、地震模型建立等等,是各个国家的战略级项目。可以说超算是一个国家综合实力的体现,在科学研究、国防建设、经济建设等方面均具有巨大作用。
凭借靠着天河二号、太湖之光,中国的超算一直位居世界前列。如今计算科学(高性能计算)已与理论研究、实验科学相并列,成为现代科学的三大支柱之一。随着越来越多的学科、专业,如通信工程、医药学、生物工程学等采用计算仿真与模拟来进行研发和实验,处于学科前沿的高校对HPC的需求近年来出现井喷。
高性能计算不仅仅是计算能力,其使用场景也正在变得更加多元化。英特尔的IA架构以及IA架构在相关高性能计算的使用已经不局限于CPU,英特尔和国内客户开展了丰富的合作,对中国超算做出了自己的贡献。
英特尔做出大量投入,使得优化软件更好地利用每一代的硬件产品,在更多新的使用场景与工作负载上可以发挥英特尔的技术和产品的特点。而这种投入不是以产品的方式体现,而是以服务的方式体现的,这一点也是英特尔和很多合作伙伴、终端用户合作时的主要工作。
“三步走”的战略
英特尔和清华大学的合作可以说是方方面面的,不仅仅是超算。一个是架构方面的,一个是偏向于应用和软件方面的。清华大学希望构建一个全新的超算平台,而这个超算平台基本上是每两年都会有一个新的需求提出,比如新的应用领域和应用方向。英特尔根据这些需求变化从架构角度和客户沟通,帮助他们打造最合理、成本最低、性能最好的超算平台架构。
清华大学高性能计算中心张武生表示,清华大学的超算平台是一个全校的公共平台,各个院系的项目非常多,涉及的领域也很多。这不光涉及应用优化,还包括应用移植。所以,我们在选择的时候会选择稳妥的方案,确保平台能够承载足够多的用户来使用,这样应用的性能会有保证,移植和优化的投入也会更少。
张武生还列举了一个例子,清华大学在平台应用移植过程中曾出现了一些问题,这些问题对不熟悉CPU架构的人来说解决起来很困难。“当时英特尔调集了很多同事帮助我们来解决这个问题,最后还是非常准确的能够定位到原因的,然后把这个计算能够做得跟在其他平台上算的东西是一样的,这个让我的感触非常深,当时离开厂家的支持,把优化做细是不太容易的。我们最熟悉的是英特尔平台,而且,清华大学和英特尔这么多年来一直在合作,英特尔给清华大学的支持力度也是非常大的,所以我们选择英特尔平台。”
在超算平台建设中,规划很重要。因为超算平台存在迭代周期,英特尔会第一时间与客户沟通,倒推下一次的采购时间,是不是与英特尔的产品更新吻合。毕竟采用最新的技术产品对于平台性能的提升是显而易见的。英特尔会确保用户使用到最新最及时的产品和技术工具。
张武生说,CPU更新换代,我们需要借助平台方帮助我们实现这个优化,特别是细节的调优,追求极致性能的一些应用,更体现出平台方支持的重要性。目前我们使用的平台大部分都是英特尔架构,各个年代的CPU都有,在某一代CPU上运行得很好的程序,到了新一代CPU上可能需要重新优化,在这方面英特尔也给了我们很大的支持。
在客户需求响应方面,英特尔所作的工作获得了清华大学的认可。比如针对最新的HPC应用场景,英特尔的新产品可以完美支持。为此,英特尔专门为清华大学调度了一个测试平台,进行应用场景的测试。“英特尔对我们的需求响应是非常及时的,从需求提出来到拿到测试环境,两三周时间就可以开始测试了,对我们验证技术和方案的帮助都非常大。”张武生说。
英特尔相关负责人表示,具体到清华大学,英特尔落实了“三步走”的战略: 一是买到最适合你的,最经济的超算平台;二是我们希望有更多的科学家或者是老师、学生合理的使用这个机器,发挥它最大的效能;最后能够产生用户自觉的诉求,就是我希望用更快更多的,希望你能帮助我把它用得更好。因此,英特尔不断投入资源,与用户一起成长。
英特尔与清华大学的合作是长期的、稳定的、互利的,英特尔相关负责人认为。“所以在清华大学遇到技术问题的时候,英特尔都会不遗余力帮助其解决。凭借全球化的视角、技术生态,英特尔可以在底层技术上寻求解决用户应用问题的方法,进而形成产品方案。用户的需求与产品更新形成一个良性的合作循环,英特尔希望不断推动中国超算的发展水平更上一个台阶。”
“市场培养和知识传递”
中国的高性能计算成长速度非常快,从无到有,从有到多,从多到好。在国内,英特尔在高性能计算领域做的大量工作不是偏商务层面的,而更多是一种市场培养和知识传递。
在高性能计算领域,合作伙伴的重要性不言而喻,而且HPC在技术和交付模式上也在变革。并行科技是一家面向超算领域的自主软件开发型、服务型的专业HPC公司。
并行科技首席运营官乔楠表示,并行科技早期的技术是和英特尔一脉相承的,比如说应用优化和英特尔的很多工具是绑定的。随着高性能计算平台的服务化,并行科技也在与时俱进转型,双方的合作点从硬软件到人才培养,涉及各个方面。
并行科技正在进行超算云平台的建设,这里面包含大量的英特尔硬件和软件产品,比如处理器、编译器、数学库和分析工具。此外,并行科技还提供超算的设计和技术服务,在服务交付过程中,并行科技与英特尔从软件优化到超算服务也开展了很多层面的合作,为更广泛的超算用户提供服务。
虽然现在超算中心的算力架构呈现多元化趋势,但是在乔楠看来,HPC应用很大程度上是受限于单核的性能,所以单核性能很关键,而单核性能是英特尔的优势所在。另外英特尔拥有近万人工程师从事生态方面的建设,包括与各个应用厂商的合作、工具链的开发,确保生态应用软件、中间件、操作系统等在英特尔平台运行最优。
在人才培养方面,通过英特尔的工具和并行科技总结的优化手段,双方培养了一批又一批的高性能计算的高精尖人才。英特尔提供教材,并行科技派出讲师在高校巡回演讲。此外,每年并行科技与英特尔联合举办并行应用挑战赛,大赛已经成为历史悠久的知名高性能计算领域赛事,目前已经连续举办八届了,参赛选手的水平越来越高,有力壮大了国内高性能应用的人才队伍,同时也培育了中国本土的超算应用。
“需求驱动的HPC建设”
高性能计算资源的多少以及计算能力的强弱已经成为衡量高校科学技术研究水平、产品研发实力、人才培养质量和持续创新能力的重要标志。中南大学是教育部直属全国重点大学、国家“211工程”首批重点建设高校、国家“985工程”部省重点共建高水平大学和国家“2011计划”首批牵头高校,2017年9月入选世界一流大学A类建设高校,学校对高性能计算资源具有迫切的现实需求。
因此,中南大学与浪潮、英特尔强强联手,共同打造国内高校计算能力一流的高性能智算平台。作为一个硬件先进、功能齐全、资源丰富,面向全校师生提供高性能计算服务的开放性公共服务基础设施,中南大学高性能计算公共服务平台不仅可以为学校的科学研究和工程计算提供优质的服务,而且还是人才培养的重要基地,更是参与国内外高性能计算领域学术交流和科研合作的重要平台。
据悉,该平台拥有1058个计算节点,合计50896个计算核心,采用国际领先的DDN商业版Lustre并行文件系统和DDN统一集中式存储架构,可用存储容量超过2PB,最大持续读写带宽达到20GB/s,配置100Gb高速IB计算网络。CPU理论计算能力为4856万亿次,GPU理论计算能力为788万亿次,整个计算集群聚合计算能力达到5600万亿次。
中南大学大规模超算平台在我国高校里面是数一数二的,由于英特尔地产品类别选择很多,怎么帮助用户选择合适的产品实现最高性价比也是很重要的问题。而在平台搭建完成之后,在技术对接、应用培训等方面帮助用户使用好,包括分享英特尔与其他高校合作的经验,让中南大学超算平台产生更多价值,也是英特尔与中南大学合作的重中之重。
现在的HPC建设已经是需求驱动,而不单纯的基础建设思维。现在超算的应用领域越来越多,应用方式也多样化,高校也不仅仅是传统的超算建设数学模型进行项目规划,而是开展自主研发、基础研究,还有大数据、人工智能等新型应用开发,这从需求端推动了超算的发展。
目前高校的超算使用需求大致有三个:满足学科的发展、学生培养的需求、科研工作需求。
因为中南大学是理工科院校,计算需求一直存在。随着学科推进和海外人才归来为学校服务,计算缺口越来越大。在需求逐步提升的过程中,就开始有老师呼吁学校要建立大规模的平台。因此中南大学邹有老师表示,从尊重学科的目标出发,中南大学决定筹建高性能计算平台。另外,学校也希望借助这个平台整合之前分散的计算资源,像学院一般课题组或者实验室建的集群规模不大,而且分散建设容易造成资源浪费,而且在管理上缺乏专门的运维人员管理。
邹有老师表示,超算平台之所以选择英特尔,一方面是此前运行的系统平台是基于英特尔CPU的,另一方面,学校在外调研的时候,也参考了上海交通大学、中国科技大学、清华大学等高校的建设情况。英特尔对于各种软件的兼容性和性能方面表现来说都是非常优秀的,此外,英特尔平台的开放性,包括各种技术文档和培训资源非常丰富,所以最后选择了英特尔。
在超算平台管理运维方面,中南大学会与英特尔、浪潮等供应商保持紧密合作,一方面实现平台性能优化,探索深度学习这种新的应用架构,另一方面实现人才队伍的建设培养。
通过高校公共超算平台建设,校内各个学科通过平台加强沟通交流,可以实现交叉学科融合发展。另外校与校之间的交流上面,超算平台可会发挥更大的作用。
中南大学高性能计算公共服务平台的建设与学校“智慧中南”的理念不谋而合,平台将于2020年9月底建成并于10月份投入试运行,我们相信,平台的投入使用,必将极大地推动中南大学科学研究水平的提升,进一步促进科研成果的产出和拔尖创新人才的培养,为学校的“双一流”建设做出贡献。
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。