重大变化正在我们身边悄然发生。
英特尔最新公布x86指令集架构的两组扩展,其中一组用于提高通用代码性能,另一组则为后续芯片提供通用向量指令集。
英特尔开发者网站上披露相关细节,其中展示的高级性能扩展(Intel APX)进一步充实了x86指令集,可以访问更多寄存器和其他用于提高通用性能的功能。与此同时,高级向量扩展10(即Intel AVX 10)则被描述为“现代向量指令集架构”,并将在未来的英特尔处理器上得到支持。
APX代表英特尔对其未来架构的重大规模性举措。其主要特点是将通用寄存器的数量从16个增加到32个。寄存器数量的增加,意味着各种值的往来移动次数更少,英特尔称这种方式能够提高性能表现。
具体来说,它允许编译器将更多值保存在寄存器内,因此与现有指令集相比,在编译相同代码时使用APX的代码能将内存加载次数减少10%,存储需求则有望降低20%。
换言之,CPU可以把更多时间用于计算,而非处理数据移动。而寄存器访问也摆脱了以往复杂的加载和存储操作,在提升速度的同时降低功耗。
英特尔解释称,新的通用寄存器将支持XSAVE,就是说它们能够在上下文切换期间通过XSAVE/XRSTOR序列自动保存和恢复。由于寄存器能够利用之前配合现被弃用的Intel MPX扩展的寄存器分配空间,因此不再需要额外的XSAVE区域。
APX还新增了加载、存储和比较/测试指令的条件形式,用于应用软件应用因条件分支预测错误而造成的性能损失。这些是通过对旧有指令添加EVEX前缀扩展来实现的。
根据英特尔的介绍,开发人员可以重新编译代码来使用APX,而且预计无需对源代码做出修改。
外媒已经询问英特尔将何时在处理器芯片中引入新的APX指令,在得到答复后将第一时间带来更新。
英特尔还指出,AVX10是自AVX-512推出以来,首次重大向量指令集更新。其作用是为全部英特尔架构提供通用的聚合向量指令集,因此将在所有后续处理器上得到支持,包括性能核心(P核心)与能效核心(E核心)。
AVX10基于英特尔AVX-512功能集,支持所有指令向量长度(128、256及512),以及标量和opmask指令。
AVX 10的特别之处,在于其“聚合”版本似乎将在所有英特尔处理器间通用,且最大向量长度为256位并具有32位opmask寄存器。此版本也被称为英特尔AVX10/256。
部分P核处理器将继续提供对512位向量和64位opmask寄存器的支持,“适用于可利用额外向量长度的高强度向量计算类应用场景”,此版本被称为英特尔AVX10/512。
虽然听起来有点乱,但英特尔似乎打算把这项新功能推广到所有芯片,借此为能够受益的应用场景(例如AI处理)提供基准性能提升,同时简化开发者对向量指令的支持。
为此,AVX10还引入了对应各版本的指令集枚举。这是一种奇特的表述,指具有给定AVX10版本号的所有英特尔芯片都将支持相同的功能和指令。
根据英特尔的说法,开发者只需要在关注三个字段:指示AVX10支持的CPUID功能位、AVX10版本号以及最大向量支持长度。
英特尔还提到,明年推出的Granite Rapids服务器芯片将作为AVX-512到AVX10之间的过渡产品。其将采用AVX10版本1,其中不包括新的256位向量指令。
AVX10版本2将包含256位指令形式,同时涵盖新的AI数据类型和转换、数据移动优化,以及对额外指令的标准化支持。
好文章,需要你的鼓励
一加正式推出AI功能Plus Mind和Mind Space,将率先在一加13和13R上线。Plus Mind可保存、建议、存储和搜索屏幕内容,并将信息整理到Mind Space应用中。该功能可通过专用按键或手势激活,能自动创建日历条目并提供AI搜索功能。一加还计划推出三阶段AI战略,包括集成大语言模型和个人助手功能,同时将推出AI语音转录、通话助手和照片优化等工具。
北航团队推出Easy Dataset框架,通过直观的图形界面和角色驱动的生成方法,让普通用户能够轻松将各种格式文档转换为高质量的AI训练数据。该工具集成了智能文档解析、混合分块策略和个性化问答生成功能,在金融领域实验中显著提升了AI模型的专业表现,同时保持通用能力。项目已开源并获得超过9000颗GitHub星标。
预计到2035年,数据中心用电需求将增长一倍以上,达到440TWh,相当于整个加利福尼亚州的用电量。AI工作负载预计将占2030年数据中心需求的50-70%。传统冷却系统电机存在功率浪费问题,通常在30-50%负载下运行时效率急剧下降。采用高效率曲线平坦的适配电机可显著降低冷却系统功耗,某大型数据中心通过优化电机配置减少了近4MW冷却功耗,为13500台AI服务器腾出空间,年增收入900万美元。
卢森堡计算机事件响应中心开发的VLAI系统,基于RoBERTa模型,能够通过阅读漏洞描述自动判断危险等级。该系统在60万个真实漏洞数据上训练,准确率达82.8%,已集成到实际安全服务中。研究采用开源方式,为网络安全专家提供快速漏洞风险评估工具,有效解决了官方评分发布前的安全决策难题。