今天,亚马逊云科技(AWS)宣布推出全新Amazon EC2实例,该实例由定制的第四代英特尔® 至强® 可扩展处理器提供支持。此次发布的是越来越多搭载第四代英特尔至强可扩展处理器实例中的最新产品,该实例具备领先的总体拥有成本(TCO)和众多CPU内置加速器,以支持人工智能、数据库、网络和企业应用等关键工作负载。
英特尔公司副总裁兼至强产品和解决方案事业部总经理Lisa Spelman表示,“英特尔与AWS密切合作,让更多客户能够使用我们功能丰富的第四代英特尔至强可扩展处理器,其中许多客户在私有和公共预览中已经受益于其出色的性能和价值。今天,我们很高兴能够将同样的实践应用价值带给全球云客户。”
得益于AWS广泛的全球应用,Amazon EC2 M7i-flex和M7i这些全新的Amazon EC2实例为大众提供第四代英特尔至强可扩展的加速器引擎。诸如英特尔® 高级矩阵扩展(英特尔® AMX)等内置加速器为市场上需求增长的人工智能工作负载提供了一个理想选择。具备AMX的第四代英特尔至强可扩展处理器还可以满足大语言模型(LLMs)在小于200亿参数中的推理性能指标,使LLM能够在通用基础设施上实现经济高效且可持续的运行。
此外,英特尔和AWS亦为客户提供一系列产品选择,以实现工作负载、性能和定价需求的理想匹配,并通过易用性和灵活性满足未来数字基础设施需求。
M7i-flex和M7i实例可在美国东部(俄亥俄州和弗吉尼亚州)、美国西部(俄勒冈州)和欧洲(爱尔兰)的AWS支持区域使用。
M7i-flex实例提供:
M7i实例提供:
注释:
1 由英特尔于2023年7月25日测试。欲更多关于价格的信息,请联系AWS。
好文章,需要你的鼓励
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
南洋理工大学研究团队开发出Puffin统一模型,首次将AI的图像理解和生成能力融合。通过创新的"用相机思考"方法,将相机参数转换为摄影术语,让AI像摄影师一样理解空间关系。基于400万样本数据集训练,模型在相机角度理解和可控图像生成上均超越专业化模型,并支持空间想象、摄影指导等多元应用,为空间智能AI发展开辟新路径。
AI代码编辑器开发商Cursor完成23亿美元D轮融资,估值达293亿美元。Accel和Coatue领投,Google、Nvidia等参与。公司年化收入已突破10亿美元。Cursor基于微软开源VS Code打造,集成大语言模型帮助开发者编写代码和修复漏洞。其自研Composer模型采用专家混合算法,运行速度比同等质量模型快四倍。公司拥有数百万开发者用户,将用新资金推进AI研究。
KAIST研究团队开发出MPO多模态提示优化框架,首次实现同时优化文字和视觉提示,让AI能够像人类一样接收多种信息类型。该技术在10个数据集上平均性能提升6.8%,同时节省42%评估成本,为医疗影像、自动驾驶、药物研发等领域提供了新的AI交互方式,标志着从纯文字交流向多模态交流的重大突破。