从智能手机、智能手表、电视到打印机,Arm的计算机芯片以为这些消费类设备提供动力而闻名,近年来Arm一直致力于数据中心设备如网络交换机和计算机服务器,而且现在的投入力度正在不断加大。
今天,在美国加利福尼亚州圣何塞举行的TechCon会议上,Arm公布了未来几年即将推出一系列处理器平台的新愿景。这个名为Neoverse的系列处理器,目标不仅是集中驱动云计算服务的数据中心,还有可能在互联网和企业网络边缘完成的下一代计算。
这是一个大胆的举动。芯片制造巨头英特尔一直主导着主流服务器和相关的数据中心设备,更不用说个人电脑了。看起来,Neoverse的目标是在下一代云计算和边缘计算挑战英特尔——不仅仅是服务器,还包括存储、5G网络设备等等。
Arm首席执行官Simon Segars在大会上概述了由海量数据驱动的第五波计算,同时表示:“我们正在走向一个计算机无处不在的世界。在数据中心领域,Arm是全力以赴的。”
Neoverse是一套新处理器平台的总称,设计用于Arm所描述的“到2035年即将到来的1万亿个智能设备”的世界,所有这些设备都需要连接和管理。Arm称,Neoverse芯片设计将包括更高水平的芯片、软件和系统性能,而不是现有的Cortex系列高端芯片。
Arm对于基础设施领域来说并不陌生。Arm称,根据IDC的数据,Arm在基础设施领域拥有最大的市场份额(30%)——如果算上网络交换机、蜂窝基、企业网络路由器和服务器等后端设备。“几乎所有存储端口、固态硬盘、网络端口等芯片都是Arm设计的,”Floyer指出。
但Arm显然希望成为主流数据中心和下一代数据中心设备的领导者。Arm认为,现在那些优化视频等内容向智能手机和其他设备的分发的基础设施,需要做出一些改变以应对数据在网络边缘各种设备上的迁移,这就需要在数据所在的位置进行更多的分布式计算。
Arm基础设施高级副总裁Drew Henry表示:“我们作为一家公司具有独特的定位,因为我们正在与全球所有试图构建这些系统的企业进行讨论,”这些系统包括从智能设备到智能城市基础设施再到交通工具。
Wikibon首席技术官David Floyer表示,Arm正在对英特尔和其他芯片供应商发起三管齐
下的攻击:“成本更低,在成本和功耗更好的情况下性能能够与之匹敌,并且以更好的性能和更快的上市时间主导新兴的工作负载。”
Arm还公布了Neoverse芯片的路线图,涵盖从今天用于云应用处理的Cosmos平台到2019年的Ares平台芯片、2020年的Zeus平台和2021年的Poseidon平台。Arm表示,每个芯片都比上一代平台快了30%,并且增加了更多基础设施特定的功能。
Moor Insights&Strategy总裁兼首席分析师Patrick Moorhead表示:“Arm通过Neoverse加大在基础设施领域的投资,创建具有更高带宽、可许可的、完整的大核心。这是一个很大的改变和升级,以前提供的指令集许可证要求芯片客户自己创建大核心。”
除了这些芯片核心之外,Arm还增加了一些新功能实现了高性能和高安全性的架构,专门针对云原生和网络计算工作负载构建的。同时,Arm也在整合合作伙伴生态系统。
生态系统中包括微软Azure、百度、腾讯、阿里巴巴和AWS的Annapurna Labs,以及博通、高通、Marvell等芯片制造商,思科、HPE、爱立信和中兴等系统制造商,SoftBank、Sprint,BT Group unit EE、Orange Group和Vodafone Group PLC等运营商。
此外还有很多提供操作系统、软件容器和虚拟化、编程语言和库、开发工具厂商,以及像Cloud Native Computing Foundation这样的开源组织支持Neoverse。
艰难的市场
Moorhead表示,评估芯片在推出之前的潜在影响(特别是针对英特尔和其他芯片的影响)是很难的。“到目前为止,英特尔在打压竞争对手方面做得很成功,它注重投资服务器片上系统、更小体积的核心和结构。我可以说的是,相信基于Neoverse的芯片能够提供比之前Arm任何服务器芯片都要高的CPU性能。”
Arm暗示说,自己在基础设施方面的努力还需要一些时间才能看到成果。Arm产品管理高级主管Brian Jeff说:“这需要一代或者两代产品的时间。但是,市场对于不同的设计方法是很渴望的,特别是在我们向云端迈进的时候。”
这显然是一个艰难的市场,5月有报道显示,高通正在考虑退出数据中心市场。高通总裁Cristiano Amon曾在6月表示,高通并没有放弃这方面的努力,但他承认,由于对美国和中国大型互联网公司的关注不足,公司正在考虑进行裁员。
在此之前,Arm公布了一系列进入新市场的举措。上个月末,Arm推出了一系列新芯片用于自动驾驶汽车。今年早些时候,Arm发布了一项名为Project Trillium的机器学习计划,
以提供比英特尔、高通、Nvidia和Xilinx更低功耗的AI功能。
Floyer表示,Arm将设计用于大批量芯片的做法,使得Arm与英特尔及其标志性的x86系列处理器形成鲜明对比。
他说:“Arm将使用与英特尔用于将工作负载从RISC处理器迁移到x86的相同策略。Arm将利用消费者批量供货来降低成本并控制性能,并在编写新软件时不可避免地移动工作负载。”他预测,到2028年x86将占企业和云提供商处理器支出的不到10%。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。