由前英特尔总裁Renee James领导的半导体公司Ampere Computing Inc.今天早上走出隐身模式,以挑战英特尔这家芯片巨头长期以来在数据中心市场的霸主地位。
Ampere正在开发基于ARM Holdings PLC设计的处理器,后者的蓝图是成为当今绝大多数移动设备芯片的基础,部分原因在于它比Intel芯片的功效更高。对于那些希望降低数据中心运营成本的公司来说,这一点很有吸引力,这也是为什么高通技术公司押注(Qualcomm Technologies Inc.)ARM技术以进军服务器市场的原因。
类似的考量因素似乎也在推动着Ampere公司的战略。Ampere公司在新闻稿中称,公司正致力于解决现代数据中心的“内存性能、成本、空间和功耗限制”等问题。
Renee James表示,Ampere的芯片建立在64位版本的ARMv8-A体系结构上,拥有32个定制处理核心,主频最高可达到3.3千兆赫。这家初创公司还将8TB的内存和8个DDR(双倍数据速率)通道用于传输数据。这些组件共同为芯片提供了125瓦的功率包。
该处理器旨在处理各种数据中心工作负载,相比其他许多芯片创业公司,这可能会使Ampere与英特尔形成更直接的竞争关系,而这些新兴的芯片创业公司大都提供面向特定用例(如深度学习)的芯片。
与英特尔竞争不是一件简单的事情,但Ampere显然有一些资源可以应付这场战斗。私募股权巨头卡莱尔集团(Carlyle Group LP)提供的现金注入使Ampere雇用了约300名员工,并建立了多个芯片设计中心。James没有具体说明投资价值,但表示,光是ARM设计许可的成本这一项“就要比一轮融资从风投那里得到的资金还要高”。
Moor Insights&Strategy总裁兼首席分析师Patrick Moorhead表示:“正如Calxeda、AppliedMicro、Marvell、三星和博通等公司发现的那样,在数据中心与英特尔竞争,是一件充满挑战和高成本的事情。市场确实希望有更多的公司提供具有竞争力的产品,如果Ampere有资金和时间,看起来公司也确实招募了一些扎实的人才,所以结果可能会有所不同。”
James在另一个采访中说,Ampere芯片目前正在由多个潜在买家测试,其中包括微软、甲骨文和联想集团。
Ampere公司计划在今年晚些时候开始批量生产加工产品。该芯片目前的迭代是基于16纳米工艺,而下一个版本将采用7纳米晶体管。James说,她的团队目前总共有三种不同的产品在开发中,未来路线图上还有四款产品。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。