今天,亚马逊云科技(AWS)宣布推出全新Amazon EC2实例,该实例由定制的第四代英特尔® 至强® 可扩展处理器提供支持。此次发布的是越来越多搭载第四代英特尔至强可扩展处理器实例中的最新产品,该实例具备领先的总体拥有成本(TCO)和众多CPU内置加速器,以支持人工智能、数据库、网络和企业应用等关键工作负载。
英特尔公司副总裁兼至强产品和解决方案事业部总经理Lisa Spelman表示,“英特尔与AWS密切合作,让更多客户能够使用我们功能丰富的第四代英特尔至强可扩展处理器,其中许多客户在私有和公共预览中已经受益于其出色的性能和价值。今天,我们很高兴能够将同样的实践应用价值带给全球云客户。”
得益于AWS广泛的全球应用,Amazon EC2 M7i-flex和M7i这些全新的Amazon EC2实例为大众提供第四代英特尔至强可扩展的加速器引擎。诸如英特尔® 高级矩阵扩展(英特尔® AMX)等内置加速器为市场上需求增长的人工智能工作负载提供了一个理想选择。具备AMX的第四代英特尔至强可扩展处理器还可以满足大语言模型(LLMs)在小于200亿参数中的推理性能指标,使LLM能够在通用基础设施上实现经济高效且可持续的运行。
此外,英特尔和AWS亦为客户提供一系列产品选择,以实现工作负载、性能和定价需求的理想匹配,并通过易用性和灵活性满足未来数字基础设施需求。
M7i-flex和M7i实例可在美国东部(俄亥俄州和弗吉尼亚州)、美国西部(俄勒冈州)和欧洲(爱尔兰)的AWS支持区域使用。
M7i-flex实例提供:
M7i实例提供:
注释:
1 由英特尔于2023年7月25日测试。欲更多关于价格的信息,请联系AWS。
好文章,需要你的鼓励
随着AI模型参数达到数十亿甚至万亿级别,工程团队面临内存约束和计算负担等共同挑战。新兴技术正在帮助解决这些问题:输入和数据压缩技术可将模型压缩50-60%;稀疏性方法通过关注重要区域节省资源;调整上下文窗口减少系统资源消耗;动态模型和强推理系统通过自学习优化性能;扩散模型通过噪声分析生成新结果;边缘计算将数据处理转移到网络端点设备。这些创新方案为构建更高效的AI架构提供了可行路径。
清华大学团队开发了CAMS智能框架,这是首个将城市知识大模型与智能体技术结合的人类移动模拟系统。该系统仅需用户基本信息就能在真实城市中生成逼真的日常轨迹,通过三个核心模块实现了个体行为模式提取、城市空间知识生成和轨迹优化。实验表明CAMS在多项指标上显著优于现有方法,为城市规划、交通管理等领域提供了强大工具。
Meta以143亿美元投资Scale AI,获得49%股份,这是该公司在AI竞赛中最重要的战略举措。该交易解决了Meta在AI发展中面临的核心挑战:获取高质量训练数据。Scale AI创始人王亚历山大将加入Meta领导新的超级智能研究实验室。此次投资使Meta获得了Scale AI在全球的数据标注服务,包括图像、文本和视频处理能力,同时限制了竞争对手的数据获取渠道。
MIT研究团队发现了一个颠覆性的AI训练方法:那些通常被丢弃的模糊、失真的"垃圾"图片,竟然能够训练出比传统方法更优秀的AI模型。他们开发的Ambient Diffusion Omni框架通过智能识别何时使用何种质量的数据,不仅在ImageNet等权威测试中创造新纪录,还为解决AI发展的数据瓶颈问题开辟了全新道路。