根据传闻以及日前Ampere Computing的亲自爆料,今年年内,英国芯片设计厂商ARM以及同阵营中专注服务器业务的初创公司Ampere Computing很可能会双双上市,目前首轮公开募股文件已经秘密提交完成。
今年2月,监管机构重拳出击、打碎了英伟达斥巨资收购ARM的宏大计划。消息一出,关于ARM即将独立上市的传闻甚嚣尘上。结合这一背景,人们自然开始关注ARM这家CPU技术许可方、以及作为被许可方的Ampere能否获得可观资本注入,上市申请又是否同样受到审查机构的“百般刁难”。
作为一家私营企业,Ampere Computing在一年多之前刚刚从投资方手中筹集到迄今为止最大的一笔融资,总额达3亿美元。而此轮融资的唯一参与者就是甲骨文,数据库巨头明显认为基于ARM架构的Ampere Altra CPU将在云计算领域拥有强劲竞争力。事实上,根据美国证券交易委员会披露的文件,甲骨文已经先后向Ampere投入超过4亿美元,而且这家初创企业除甲骨文外就只有两家投资方——ARM以及私募股权公司凯雷投资集团。
前一段时间,媒体曾纷纷报道微软Azuer开始采用Ampere Computing的80核“Quicksilver”Altra芯片,并认定此举代表着作为公有云服务领域的两股中坚力量,微软已经挑起了与亚马逊云科技之间的新一轮ARM服务器之战。目前,亚马逊方面能够应战的是内部原研、基于ARM架构的第三代Graviton芯片。
但随着Ampere Computing在未来某个时间点上市,这家芯片设计商不仅有望获得更多资金以扩大其云客户群体,甚至有可能在业绩压力的推动下进一步冲击企业级服务器市场。毕竟过去几年以来,AMD已经成功为华尔街带来了高达两位数的数据中心业务增长,Ampere至少也要达到相同的水平才能吸引到投资者的目光。
而且最近还出现了有趣的转折:在此之前,Ampere其实是把ARM提供的“现成”Neoverse N1核心分别用于了2020年及2021年推出的Altra及Altra Max芯片当中;而从今年起,Ampere计划在即将推出的5纳米“Siryn”芯片以及2023年的再下一代处理器中使用下一代定制设计核心。
这些新款处理器同样采用ARM的指令集架构——目前尚不清楚具体架构版本,但我们怀疑是v9。由此可见,Ampere Computing这家初创企业必须支付一大笔费用才能获得ARM ISA许可,而且这项许可的授权成本要比ARM现成核心高得多。这还只是整体成本的一部分:Ampere Computing可能还需要增加更多人手,确保其核心能够在性能与效率层面对x86架构以及其他ARM架构芯片形成比较优势。
考虑到这些现实压力,Ampere Computing唯一的出路也就只有上市融资。由以上背景推断,Ampere公司过去几年来的运营成本可能已经大幅增长,包括将处理器开发思路由使用现成的许可核心、转向设计定制核心,自然需要更加稳妥的融资渠道。而且如果Ampere Computing的下一款芯片真的能够在云服务商及超大规模计算客户市场上一鸣惊人——特别是用硬实力压制住Azure等其他客户当前使用的Altra CPU——那么Ampere自己、投资者乃至ARM都将获得丰厚的回报。很明显,现在的ARM阵营比以往任何时候都需要盟友的支持,下面就看华尔街愿不愿意伸出援手了。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。