今天,亚马逊云科技(AWS)宣布推出全新Amazon EC2实例,该实例由定制的第四代英特尔® 至强® 可扩展处理器提供支持。此次发布的是越来越多搭载第四代英特尔至强可扩展处理器实例中的最新产品,该实例具备领先的总体拥有成本(TCO)和众多CPU内置加速器,以支持人工智能、数据库、网络和企业应用等关键工作负载。
英特尔公司副总裁兼至强产品和解决方案事业部总经理Lisa Spelman表示,“英特尔与AWS密切合作,让更多客户能够使用我们功能丰富的第四代英特尔至强可扩展处理器,其中许多客户在私有和公共预览中已经受益于其出色的性能和价值。今天,我们很高兴能够将同样的实践应用价值带给全球云客户。”
得益于AWS广泛的全球应用,Amazon EC2 M7i-flex和M7i这些全新的Amazon EC2实例为大众提供第四代英特尔至强可扩展的加速器引擎。诸如英特尔® 高级矩阵扩展(英特尔® AMX)等内置加速器为市场上需求增长的人工智能工作负载提供了一个理想选择。具备AMX的第四代英特尔至强可扩展处理器还可以满足大语言模型(LLMs)在小于200亿参数中的推理性能指标,使LLM能够在通用基础设施上实现经济高效且可持续的运行。
此外,英特尔和AWS亦为客户提供一系列产品选择,以实现工作负载、性能和定价需求的理想匹配,并通过易用性和灵活性满足未来数字基础设施需求。
M7i-flex和M7i实例可在美国东部(俄亥俄州和弗吉尼亚州)、美国西部(俄勒冈州)和欧洲(爱尔兰)的AWS支持区域使用。
M7i-flex实例提供:
M7i实例提供:
注释:
1 由英特尔于2023年7月25日测试。欲更多关于价格的信息,请联系AWS。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。