日前,在在Hot Chips 2023大会上,英特尔公布了下一代至强处理器即将迎来的更多架构变化,包括对内存子系统和IO连接的改进。
此前,英特尔宣布,将把至强系列分为P-Core和E-Core两个系列,前者就是之前的至强系列,后者是新增加的节能架构,将提供更好的电源效率。
英特尔宣布将在明年推出两款采用Intel 3工艺技术的至强新品——为计算密集型和人工智能工作负载优化的高性能核心(P核)和针对高密度和横向扩展工作负载优化的高能效核心(E核)。E 核至强处理器(代号Sierra Forest)将在2024年上半年问世,P核至强处理器(代号Granite Rapids)将紧随其后登场。
英特尔将至强处理器称作 "人工智能的最佳 CPU",Granite Rapids可将AI工作负载性能提升2-3倍,增强的英特尔AMX支持新的FP16指令,实现2.8倍的更好内存带宽,内存模组MCR DIMM带宽可提高30-40%;
而Sierra Forest可在机架级别将机架密度提高250%,将每瓦性能提高240%,支持1路和2路服务器,每个CPU最多可达144核心,TDP低至200瓦。
下一代创新平台架构
作为英特尔至强的重要演进,下一代产品引入了全新的能效核(E-core)架构,与其已有的性能核(P-core)架构并存。分别以代号Sierra Forest和Granite Rapids命名的这些新产品将为客户提供便捷性和灵活性,以及兼容的硬件架构和共享的软件堆栈,以满足诸如人工智能等关键工作负载的多元化需求。
未来的英特尔至强处理器引入了一种新架构,该架构采用模块化设计方式,通过Fabric技术把模块化die互连,实现灵活的架构,可将独立的计算和I/O的Chiplets(常译为 " 芯粒 "、" 小芯片 ")进行灵活组合,并借助EmiB封装技术实现高带宽和低延迟。基于该架构的模块化SoC包含通用IP、固件、操作系统、平台组件等组件。
基于系统级芯片(SoCs),全新英特尔至强平台具备增强的可扩展性和灵活性,能够提供一系列产品,满足人工智能、云计算和企业应用不断增长的规模、传输和能效需求。这一创新架构亦通过提供两种不同的插槽兼容处理器,使客户能够便捷处理大多数工作负载,且可互换使用,从而为客户提供高性价比。
下一代至强架构具有可扩展性,将提供P核和E核版本,支持1S-8S规格的P核、1S-2S规格的E核。基于这些功能,不同工艺节点之间能够进行匹配,从而得以实现性能和能效的最佳平衡。
得益于I/O和内存子系统的进步,这一架构提供了高性能和平台灵活性的优化,逻辑单片计算集群相较以往的产品提供了更好的每瓦特性能和每线程性能,并为未来代号为Granite Rapids和Sierra Forest的英特尔至强处理器奠定基础。
据悉,英特尔近期出货了第一百万片第四代英特尔至强可扩展处理器,代号为Emerald Rapids的第五代英特尔至强可扩展处理器也将于今年第四季度发布。
好文章,需要你的鼓励
AI项目从试点转向生产阶段时,企业面临意外的云成本激增问题。推理工作负载需要全天候运行以确保服务正常,成本可能一夜间飙升1000%以上。许多公司每月费用从5000美元激增至50000美元。为控制成本,企业开始采用混合架构:将推理工作负载迁移至本地或托管设施,训练任务保留在云端。这种模式可削减60-80%的基础设施支出,在保持性能的同时实现成本可预测性。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
企业在AI模型选择上面临开放源码与封闭专有技术的抉择,这一选择对财务和定制化都有重要影响。开放模型如Meta Llama提供更大控制权和定制选项,而封闭模型如OpenAI GPT-4o提供简化使用和企业级支持。专家建议采用投资组合策略,根据准确性、延迟、成本、安全性等因素选择合适模型,而非单一选择。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。