今天,亚马逊云科技(AWS)宣布推出全新Amazon EC2实例,该实例由定制的第四代英特尔® 至强® 可扩展处理器提供支持。此次发布的是越来越多搭载第四代英特尔至强可扩展处理器实例中的最新产品,该实例具备领先的总体拥有成本(TCO)和众多CPU内置加速器,以支持人工智能、数据库、网络和企业应用等关键工作负载。
英特尔公司副总裁兼至强产品和解决方案事业部总经理Lisa Spelman表示,“英特尔与AWS密切合作,让更多客户能够使用我们功能丰富的第四代英特尔至强可扩展处理器,其中许多客户在私有和公共预览中已经受益于其出色的性能和价值。今天,我们很高兴能够将同样的实践应用价值带给全球云客户。”
得益于AWS广泛的全球应用,Amazon EC2 M7i-flex和M7i这些全新的Amazon EC2实例为大众提供第四代英特尔至强可扩展的加速器引擎。诸如英特尔® 高级矩阵扩展(英特尔® AMX)等内置加速器为市场上需求增长的人工智能工作负载提供了一个理想选择。具备AMX的第四代英特尔至强可扩展处理器还可以满足大语言模型(LLMs)在小于200亿参数中的推理性能指标,使LLM能够在通用基础设施上实现经济高效且可持续的运行。
此外,英特尔和AWS亦为客户提供一系列产品选择,以实现工作负载、性能和定价需求的理想匹配,并通过易用性和灵活性满足未来数字基础设施需求。
M7i-flex和M7i实例可在美国东部(俄亥俄州和弗吉尼亚州)、美国西部(俄勒冈州)和欧洲(爱尔兰)的AWS支持区域使用。
M7i-flex实例提供:
M7i实例提供:
注释:
1 由英特尔于2023年7月25日测试。欲更多关于价格的信息,请联系AWS。
好文章,需要你的鼓励
随着数字化时代的到来,网络安全威胁呈指数级增长。勒索软件、AI驱动的网络攻击和物联网设备漏洞成为主要威胁。企业需要建立全面的风险管理策略,包括风险评估、安全措施实施和持续监控。新兴技术如人工智能、区块链和量子计算为网络安全带来新机遇。组织应重视员工培训、供应链安全、数据治理和事件响应能力建设。
滑铁卢大学研究团队开发出ScholarCopilot,一个革命性的AI学术写作助手。该系统突破传统"先检索后生成"模式,实现写作过程中的动态文献检索和精确引用。基于50万篇arXiv论文训练,引用准确率达40.1%,大幅超越现有方法。在人类专家评估中,引用质量获100%好评,整体表现优于ChatGPT。这项创新为AI辅助学术写作开辟新道路。
AWS Amazon Bedrock负责人Atul Deo正致力于让人工智能软件变得更便宜和更智能。他在12月re:Invent大会前只有六个月时间来证明这一目标的可行性。Deo表示AI领域发展速度前所未有,模型每几周就会改进,但客户只有在经济效益合理时才会部署。为此,AWS推出了提示缓存、智能路由、批处理模式等功能来降低推理成本,同时开发能执行多步骤任务的自主代理软件,将AI应用从聊天机器人转向实际业务流程自动化。
哥伦比亚大学研究团队发布NodeRAG技术,通过异构图结构革新智能问答系统。该方法将文档信息分解为7种节点类型,采用双重搜索机制,在多个权威测试中准确率达89.5%,检索效率提升50%以上,为智能信息检索技术带来重大突破。