英特尔注意了:企业计算的未来已经初具雏形,其核心不一定是x86处理器。
这是市场研究公司Wikibon首席技术官David Floyer通过一系列分析中得出的结论。Floyer表示,基于精简指令集的Arm处理器,在手机和平板电脑中已经无处不在,到本世纪20年代末,Arm处理器将承载越来越多的企业工作负载,为72%的新型企业服务器提供动力。
x86芯片几乎完全是由英特尔和AMD这两家厂商设计和制造的,而与x86芯片不同的是,Arm处理器则是由十几家半导体厂商基于Arm授权的设计制造生产的。AWS和Google以及苹果等手机制造商、特斯拉等汽车制造商都采用了Arm的芯片设计。
Floyer写道:“与x86相比,Arm处理器的数量是全球晶圆数量的10倍。”这不仅降低了Arm处理器的成本,而且也让新的设计能够得到蓬勃发展。
“基于Arm处理器的系统的性能水平已经相当于或者超过了传统的x86系统。”他预计,Arm处理器及其生态系统“将在未来十年内主导企业异构计算市场”。
面向边缘的新型架构
异构计算是一种相对较新的系统设计形式,在芯片上结合了不止一种处理器,包括传统CPU、GPU、ASIC以及FPGA,还有专门为机器学习设计新型处理器——神经处理单元。
移动设备制造商在产品中采用异构计算硬件由来已久,但是数据中心已经被传统的、复杂的指令集芯片架构所主导,这些体系结构经过优化可高速处理串行任务。Floyer认为,随着边缘计算的兴起,这一切都将发生改变。
边缘架构将大量智能性置于收集数据的网络边缘,而且其中大部分处理都是实时完成的,只有少量数据会穿越网络到达中央云。最常见的例子是自动驾驶型汽车,这种汽车将处理器配置到车辆中,以便能够做出瞬时决策,仅通过网络传递摘要或者异常数据。
这种系统是基于矩阵工作负载的,这是一种涉及处理大量实时数据的应用,例如上面提到的自动驾驶汽车的例子。矩阵工作负载必须根据需要进行并行处理,因此不适用于以串行为主导的传统计算架构。
但是,基于Arm的异构计算机架构是一个理想选择,处理器和有限的中间存储介质之间的连接是灵活的、低延迟的、高带宽的。这种架构采用传统的SRAM而不是传统的DRAM,前者的架构更高,但速度更快,功耗降低达99%。由于矩阵工作负载会小批量处理信息并丢弃大量信息,因此SRAM的成本和容量限制不是一个特别重要的问题。
但是Floyer认为,Arm架构的应用将不仅限于网络边缘,还将有更广泛的应用范围。如果让矩阵和传统工作负载分别运行在基于Arm的苹果iPhone 11和基于英特尔Ice Lake处理器的PC,会发现在运行传统工作负载时,iPhone仅慢了5%,但成本却降低了70%多。在运行矩阵工作负载时,iPhone的速度提高了50倍,而成本却降低了99%。Arm系统的四年电费也能降低99%。
Floyer表示,由于处理器设计和制造的分离,Arm正在退出x86市场。例如,特斯拉通过使用Arm设计打造了一台车载计算机,在三年时间内,实现每秒处理来自8个摄像头的10亿个像素,以及对来雷达、12个超声传感器、GPS和多个内部车辆传感器的数据进行流式处理。Floyer写道:“如果处理器设计和制造不分离的话,本来这些需要六年多时间,而且要冒着可能失败的巨大风险。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。