近日,亚马逊云科技(AWS)宣布推出Amazon EC2 R7iz实例的私人预览版,该实例采用代号为Sapphire Rapids的第四代英特尔®至强®可扩展处理器。
R7iz实例提供高达3.9 GHz的全核睿频频率,与类似的高频率EC2实例相比,该实例的性能提升最高可达20%。基于第四代英特尔®至强®可扩展处理器和AWS Nitro系统,R7iz实例能够提供含专用硬件和轻型虚拟机管理程序的组合,在降低总体成本的同时,实现性能和安全性的大幅提升。
基于此,客户能够进一步提升计算密集型和内存密集型工作负载的性能,如电子设计自动化(EDA)、单核授权费极高的关系数据库工作负载,以及金融、精算和数据分析模拟工作负载。
为满足客户对更高内存和可扩展性的需求,R7iz实例提供多种规模,拥有最多达128个虚拟中央处理器(vCPU)和最高1,024 GB内存,最高可达类似高频率实例的2.6倍。作为第一个采用DDR5内存且基于x86的EC2实例,与类似的高频率实例相比,R7iz可提供最高可达2.4倍的内存带宽。
英特尔公司副总裁兼至强产品部总经理Lisa Spelman表示:“数据中心客户非常期待产品能够满足日益增长的需求,并在实现数据商业价值最大化的同时降低总体成本。而AWS打造的全新实例,则基于具备更高性能和安全性的第四代英特尔®至强®可扩展处理器,能够满足最严苛的工作负载需求。”
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。