近期,关于Arm芯片的新闻不断。第一个新闻是WWDC2020大会上,苹果将针对旗下的Mac系列产品推出基于Arm架构的全新定制芯片,从而开始逐步摆脱对基于x86架构的Intel处理器的依赖。第二个新闻是在ISC2020上,以富士通的48核Arm处理器A64FX打造的超级计算机Fugaku在TOP500世界500强超级计算机的6月份测试中夺得第一名,为ARM处理器多年来首次“登顶”。
两条新闻的出现应该不是巧合,这足以看出当今计算架构的多元化发展。既今年3月,安晟培半导体科技有限公司(Ampere Computing)发布拥有80个64位Arm处理器内核“首款云原生处理器”Ampere Altra后。近日,Ampere披露了其云原生处理器系列产品的扩展成员Ampere Altra Max的初步信息,该产品将拥有128个内核,能够为客户提供优化的云计算处理器,实现单芯片整体性能以及机架内核部署密度的最大化。
Ampere产品高级副总裁Jeff Wittich告诉记者,采用Ampere Altra Max的应用将充分发挥横向扩展和弹性云架构优势。它兼容Ampere 80核的Altra处理器,并支持双路服务器平台。此外,它还将为行业带来最高的插槽级性能和I/O可扩展性,并于第四季度提供样品。
Jeff表示,未来处理器将会迎来快速发展,而Arm架构的CPU的性能表现满足客户的不同类型工作负载需求,比如密度、性能、功耗等。另外,围绕着Arm生态系统不断成熟,包括软件应用和操作系统等。“Arm让公司基于IP进行创新,有益于整个生态系统的发展。对于Ampere来说,我们也能够有更多的获益,在生态系统当中获得更多的选择。”
面向云原生而生
毋庸置疑,现在数据中心的架构发生了巨大的变化,比如云原生的兴起。所以在算力层面,未来的CPU需要满足云原生的特点。
Jeff表示,未来云原生特殊要求的处理器需要有三个比较明显的要求,第一个是可预测的高性能,第二、高扩展性,第三是高能效。“这三点是数据中心,包括未来的云计算一直所需要的未来的处理器所能够满足的三个方面的特点。”
当下云原生趋势非常明显,预计到2023年80%的工作负载将会迁移到容器和微服务。这意味着未来CPU需要更多的单核可预测,每个单核的性能是可预测的;需要更高的内核的密度;需要单核的功耗更低,功效更好,而且这种趋势在未来也会不断加速。
基于这样的洞察,作为世界首款的云原生处理器,Ampere Altra具备诸多亮点,实现了可预测的高性能、高扩展性和高能效,满足云计算在性能、扩展性、能效的需求。
Ampere Altra凭借其单核单线程的内核设计将提供可预测的高性能、用户的安全隔离、全平台的灵活扩展性以及全新水平的高能效。Ampere Altra处理器具有80个内核和210W的功耗,为日新月异发展的前沿科技领域如数据分析、人工智能、数据库、数据存储、电信堆栈、边缘计算、Web主机与云原生应用等提供突破性的能效提升。
Ampere Altra单路多达80个单线程内核,双路多达160个内核,能够提供可预测的非常高的性能。并且Ampere Altra利用Monolithic die(即单芯片设计)工艺,所有的核在Mesh网络互连下相互连结,提供非常高的内存带宽、内存密度和一致性互联Mesh网络。
此外,Ampere Altra还能够提供多路的支持,还能够提供非常灵活的IO连接以及高带宽。比如Ampere Altra支持8通道DDR4-3200内存,单路内存容量多达4TB;单路配置支持128 条PCIe Gen4 通道,双路配置支持192条通道。
面对人工智能等新型工作负载,推理越来越重要,Ampere Altra采用CCIX协议,支持加速器一致性互联;两个128位SIMD单元;使用int8和fp16运算指令进行AI加速。
针对云计算的扩展性需求,Ampere Altra依据行业最领先的每核功耗提供最高的可扩展性,从边缘到超大规模云不同部署环境下提供多种可选的处理器配置。
Ampere Altra系列提供了解决各种工作负载的灵活性,并且Ampere正在与生态系统中的伙伴合作,以满足客户的特定需求。
当前其实很多软件应用是运行在x86架构上面,而从x86到Arm,特别是应用到Ampere Altra处理器的终端用户所需要做的工作越来越少,因为Ampere软件工程师进行支持,保证基础方面的工作顺利进行。
Ampere也在内核优化、Java方面做了很多工作,将基础软件的迭代更新进行实时整合更新,保证在Ampere Altra平台上运行不会出现问题。
Jeff说,在过去几个月当中,Ampere一直和中国、美国的几家云服务商进行密切的合作,集中于研究如何能够提高客户应用的性能,以及展示Ampere Altra处理器高性能及其稳定性。
经过测试,随着核数不断的增加,Ampere Altra处理器所实现的性能扩展也是非常完美的,性能随着核数的增加而增加。随着核数增加到160个,Ampere Altra能够实现理论上最理想性能的98%。
Ampere Altra Max的新征程
Jeff表示,80核心已经是行业内部核数量最高的云原生处理器,而Ampere Altra Max的128个内核会将Ampere行业核数最多的优势保持下去。
据悉,Ampere Altra Max基于7纳米制程工艺,样品会在2020年的第四季度提供。Ampere Altra Max和Ampere Altra两款产品兼容于同样的平台,这就意味着从客户开发平台用于Ampere Altra,也同样可以用于Ampere Altra系列的其他产品,也就是Altra Max。
而且,Ampere近期完成了用于内部验证的5nm测试芯片的流片,以实现每年提供新产品节奏的承诺。
“云端工作流是多种多样的,有些工作流特别适合Ampere Altra,有的工作特别适合Ampere Altra Max,客户会找到一个非常好的选择。比如有的应用强调IO外部连接和内存,Ampere Altra是非常好的一个实用处理器,而那些扩展性非常强的工作负载会更加积极使用高核数的Ampere Altra Max处理器。”Jeff说。
Ampere产品的设计理念是服务于云服务商和ODM,目前Ampere产品一共有11个品类的系列产品,客户可以根据他们应用类型和TDP的偏好进行选择。
Jeff表示,Ampere是全球化研发团队,他们经验丰富,分布在在中国、印度、越南、美国等全球各地。同时,Ampere拥有强大的工程师团队为客户直接提供服务,在中国上海Ampere就有为客户应用软件方面提供支持的工程师团队。
目前,Ampere与CloudFlare、Packet、Scaleway、Phoenics、Genymobile、NVIDIA等展开了合作。Jeff透露,未来几个月,Ampere还会宣布一系列新的系统集成商合作伙伴,特别是中国的合作伙伴。
结语
我们现在处于云计算时代。如果我们看过去十到十五年,云计算的需求已经与以前基于企业级计算演进而来的云计算发生了很大的变化。
而Ampere基于Arm架构进行的创新工作让客户有了全新的选择,更好地应对日渐多元化的云端工作负载,驱动自身的业务创新。
好文章,需要你的鼓励
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
英国政府研究显示,神经多样性员工从AI聊天机器人中获得的收益远超普通同事。在Microsoft 365 Copilot试点中,神经多样性员工满意度达90%置信水平,推荐度达95%置信水平,均显著高于其他用户。患有ADHD和阅读障碍的员工表示AI工具为他们提供了前所未有的工作支持,特别是在报告撰写方面。研究表明,AI工具正在填补传统无障碍技术未能解决的职场差距,为残障人士提供了隐形的工作辅助。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。