近期,关于Arm芯片的新闻不断。第一个新闻是WWDC2020大会上,苹果将针对旗下的Mac系列产品推出基于Arm架构的全新定制芯片,从而开始逐步摆脱对基于x86架构的Intel处理器的依赖。第二个新闻是在ISC2020上,以富士通的48核Arm处理器A64FX打造的超级计算机Fugaku在TOP500世界500强超级计算机的6月份测试中夺得第一名,为ARM处理器多年来首次“登顶”。
两条新闻的出现应该不是巧合,这足以看出当今计算架构的多元化发展。既今年3月,安晟培半导体科技有限公司(Ampere Computing)发布拥有80个64位Arm处理器内核“首款云原生处理器”Ampere Altra后。近日,Ampere披露了其云原生处理器系列产品的扩展成员Ampere Altra Max的初步信息,该产品将拥有128个内核,能够为客户提供优化的云计算处理器,实现单芯片整体性能以及机架内核部署密度的最大化。
Ampere产品高级副总裁Jeff Wittich告诉记者,采用Ampere Altra Max的应用将充分发挥横向扩展和弹性云架构优势。它兼容Ampere 80核的Altra处理器,并支持双路服务器平台。此外,它还将为行业带来最高的插槽级性能和I/O可扩展性,并于第四季度提供样品。
Jeff表示,未来处理器将会迎来快速发展,而Arm架构的CPU的性能表现满足客户的不同类型工作负载需求,比如密度、性能、功耗等。另外,围绕着Arm生态系统不断成熟,包括软件应用和操作系统等。“Arm让公司基于IP进行创新,有益于整个生态系统的发展。对于Ampere来说,我们也能够有更多的获益,在生态系统当中获得更多的选择。”
面向云原生而生
毋庸置疑,现在数据中心的架构发生了巨大的变化,比如云原生的兴起。所以在算力层面,未来的CPU需要满足云原生的特点。
Jeff表示,未来云原生特殊要求的处理器需要有三个比较明显的要求,第一个是可预测的高性能,第二、高扩展性,第三是高能效。“这三点是数据中心,包括未来的云计算一直所需要的未来的处理器所能够满足的三个方面的特点。”
当下云原生趋势非常明显,预计到2023年80%的工作负载将会迁移到容器和微服务。这意味着未来CPU需要更多的单核可预测,每个单核的性能是可预测的;需要更高的内核的密度;需要单核的功耗更低,功效更好,而且这种趋势在未来也会不断加速。
基于这样的洞察,作为世界首款的云原生处理器,Ampere Altra具备诸多亮点,实现了可预测的高性能、高扩展性和高能效,满足云计算在性能、扩展性、能效的需求。
Ampere Altra凭借其单核单线程的内核设计将提供可预测的高性能、用户的安全隔离、全平台的灵活扩展性以及全新水平的高能效。Ampere Altra处理器具有80个内核和210W的功耗,为日新月异发展的前沿科技领域如数据分析、人工智能、数据库、数据存储、电信堆栈、边缘计算、Web主机与云原生应用等提供突破性的能效提升。
Ampere Altra单路多达80个单线程内核,双路多达160个内核,能够提供可预测的非常高的性能。并且Ampere Altra利用Monolithic die(即单芯片设计)工艺,所有的核在Mesh网络互连下相互连结,提供非常高的内存带宽、内存密度和一致性互联Mesh网络。
此外,Ampere Altra还能够提供多路的支持,还能够提供非常灵活的IO连接以及高带宽。比如Ampere Altra支持8通道DDR4-3200内存,单路内存容量多达4TB;单路配置支持128 条PCIe Gen4 通道,双路配置支持192条通道。
面对人工智能等新型工作负载,推理越来越重要,Ampere Altra采用CCIX协议,支持加速器一致性互联;两个128位SIMD单元;使用int8和fp16运算指令进行AI加速。
针对云计算的扩展性需求,Ampere Altra依据行业最领先的每核功耗提供最高的可扩展性,从边缘到超大规模云不同部署环境下提供多种可选的处理器配置。
Ampere Altra系列提供了解决各种工作负载的灵活性,并且Ampere正在与生态系统中的伙伴合作,以满足客户的特定需求。
当前其实很多软件应用是运行在x86架构上面,而从x86到Arm,特别是应用到Ampere Altra处理器的终端用户所需要做的工作越来越少,因为Ampere软件工程师进行支持,保证基础方面的工作顺利进行。
Ampere也在内核优化、Java方面做了很多工作,将基础软件的迭代更新进行实时整合更新,保证在Ampere Altra平台上运行不会出现问题。
Jeff说,在过去几个月当中,Ampere一直和中国、美国的几家云服务商进行密切的合作,集中于研究如何能够提高客户应用的性能,以及展示Ampere Altra处理器高性能及其稳定性。
经过测试,随着核数不断的增加,Ampere Altra处理器所实现的性能扩展也是非常完美的,性能随着核数的增加而增加。随着核数增加到160个,Ampere Altra能够实现理论上最理想性能的98%。
Ampere Altra Max的新征程
Jeff表示,80核心已经是行业内部核数量最高的云原生处理器,而Ampere Altra Max的128个内核会将Ampere行业核数最多的优势保持下去。
据悉,Ampere Altra Max基于7纳米制程工艺,样品会在2020年的第四季度提供。Ampere Altra Max和Ampere Altra两款产品兼容于同样的平台,这就意味着从客户开发平台用于Ampere Altra,也同样可以用于Ampere Altra系列的其他产品,也就是Altra Max。
而且,Ampere近期完成了用于内部验证的5nm测试芯片的流片,以实现每年提供新产品节奏的承诺。
“云端工作流是多种多样的,有些工作流特别适合Ampere Altra,有的工作特别适合Ampere Altra Max,客户会找到一个非常好的选择。比如有的应用强调IO外部连接和内存,Ampere Altra是非常好的一个实用处理器,而那些扩展性非常强的工作负载会更加积极使用高核数的Ampere Altra Max处理器。”Jeff说。
Ampere产品的设计理念是服务于云服务商和ODM,目前Ampere产品一共有11个品类的系列产品,客户可以根据他们应用类型和TDP的偏好进行选择。
Jeff表示,Ampere是全球化研发团队,他们经验丰富,分布在在中国、印度、越南、美国等全球各地。同时,Ampere拥有强大的工程师团队为客户直接提供服务,在中国上海Ampere就有为客户应用软件方面提供支持的工程师团队。
目前,Ampere与CloudFlare、Packet、Scaleway、Phoenics、Genymobile、NVIDIA等展开了合作。Jeff透露,未来几个月,Ampere还会宣布一系列新的系统集成商合作伙伴,特别是中国的合作伙伴。
结语
我们现在处于云计算时代。如果我们看过去十到十五年,云计算的需求已经与以前基于企业级计算演进而来的云计算发生了很大的变化。
而Ampere基于Arm架构进行的创新工作让客户有了全新的选择,更好地应对日渐多元化的云端工作负载,驱动自身的业务创新。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。