英特尔注意了:企业计算的未来已经初具雏形,其核心不一定是x86处理器。
这是市场研究公司Wikibon首席技术官David Floyer通过一系列分析中得出的结论。Floyer表示,基于精简指令集的Arm处理器,在手机和平板电脑中已经无处不在,到本世纪20年代末,Arm处理器将承载越来越多的企业工作负载,为72%的新型企业服务器提供动力。
x86芯片几乎完全是由英特尔和AMD这两家厂商设计和制造的,而与x86芯片不同的是,Arm处理器则是由十几家半导体厂商基于Arm授权的设计制造生产的。AWS和Google以及苹果等手机制造商、特斯拉等汽车制造商都采用了Arm的芯片设计。
Floyer写道:“与x86相比,Arm处理器的数量是全球晶圆数量的10倍。”这不仅降低了Arm处理器的成本,而且也让新的设计能够得到蓬勃发展。
“基于Arm处理器的系统的性能水平已经相当于或者超过了传统的x86系统。”他预计,Arm处理器及其生态系统“将在未来十年内主导企业异构计算市场”。
面向边缘的新型架构
异构计算是一种相对较新的系统设计形式,在芯片上结合了不止一种处理器,包括传统CPU、GPU、ASIC以及FPGA,还有专门为机器学习设计新型处理器——神经处理单元。
移动设备制造商在产品中采用异构计算硬件由来已久,但是数据中心已经被传统的、复杂的指令集芯片架构所主导,这些体系结构经过优化可高速处理串行任务。Floyer认为,随着边缘计算的兴起,这一切都将发生改变。
边缘架构将大量智能性置于收集数据的网络边缘,而且其中大部分处理都是实时完成的,只有少量数据会穿越网络到达中央云。最常见的例子是自动驾驶型汽车,这种汽车将处理器配置到车辆中,以便能够做出瞬时决策,仅通过网络传递摘要或者异常数据。
这种系统是基于矩阵工作负载的,这是一种涉及处理大量实时数据的应用,例如上面提到的自动驾驶汽车的例子。矩阵工作负载必须根据需要进行并行处理,因此不适用于以串行为主导的传统计算架构。
但是,基于Arm的异构计算机架构是一个理想选择,处理器和有限的中间存储介质之间的连接是灵活的、低延迟的、高带宽的。这种架构采用传统的SRAM而不是传统的DRAM,前者的架构更高,但速度更快,功耗降低达99%。由于矩阵工作负载会小批量处理信息并丢弃大量信息,因此SRAM的成本和容量限制不是一个特别重要的问题。
但是Floyer认为,Arm架构的应用将不仅限于网络边缘,还将有更广泛的应用范围。如果让矩阵和传统工作负载分别运行在基于Arm的苹果iPhone 11和基于英特尔Ice Lake处理器的PC,会发现在运行传统工作负载时,iPhone仅慢了5%,但成本却降低了70%多。在运行矩阵工作负载时,iPhone的速度提高了50倍,而成本却降低了99%。Arm系统的四年电费也能降低99%。
Floyer表示,由于处理器设计和制造的分离,Arm正在退出x86市场。例如,特斯拉通过使用Arm设计打造了一台车载计算机,在三年时间内,实现每秒处理来自8个摄像头的10亿个像素,以及对来雷达、12个超声传感器、GPS和多个内部车辆传感器的数据进行流式处理。Floyer写道:“如果处理器设计和制造不分离的话,本来这些需要六年多时间,而且要冒着可能失败的巨大风险。”
好文章,需要你的鼓励
无人机食品配送服务商Flytrex与全球知名披萨连锁品牌Little Caesars宣布合作,推出全新Sky2无人机,最大载重达4公斤,可一次配送两个大披萨及饮料,满足全家用餐需求。Sky2支持最远6.4公里的配送范围,平均从起飞到送达仅需4.5分钟。首个试点门店已在德克萨斯州怀利市上线,并实现与Little Caesars订单系统的直接集成。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
法国社会住房项目ViliaSprint?已正式完工,成为欧洲最大的3D打印多户住宅建筑,共12套公寓,建筑面积800平方米。项目由PERI 3D Construction使用COBOD BOD2打印机完成,整体工期较传统建造缩短3个月,实际打印仅用34天(原计划50天),现场操作人员从6人减至3人,建筑废料率从10%降至5%。建筑采用可打印混凝土,集成光伏板及热泵系统,能源自给率约达60%。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。