日前,在在Hot Chips 2023大会上,英特尔公布了下一代至强处理器即将迎来的更多架构变化,包括对内存子系统和IO连接的改进。
此前,英特尔宣布,将把至强系列分为P-Core和E-Core两个系列,前者就是之前的至强系列,后者是新增加的节能架构,将提供更好的电源效率。
英特尔宣布将在明年推出两款采用Intel 3工艺技术的至强新品——为计算密集型和人工智能工作负载优化的高性能核心(P核)和针对高密度和横向扩展工作负载优化的高能效核心(E核)。E 核至强处理器(代号Sierra Forest)将在2024年上半年问世,P核至强处理器(代号Granite Rapids)将紧随其后登场。
英特尔将至强处理器称作 "人工智能的最佳 CPU",Granite Rapids可将AI工作负载性能提升2-3倍,增强的英特尔AMX支持新的FP16指令,实现2.8倍的更好内存带宽,内存模组MCR DIMM带宽可提高30-40%;
而Sierra Forest可在机架级别将机架密度提高250%,将每瓦性能提高240%,支持1路和2路服务器,每个CPU最多可达144核心,TDP低至200瓦。
下一代创新平台架构
作为英特尔至强的重要演进,下一代产品引入了全新的能效核(E-core)架构,与其已有的性能核(P-core)架构并存。分别以代号Sierra Forest和Granite Rapids命名的这些新产品将为客户提供便捷性和灵活性,以及兼容的硬件架构和共享的软件堆栈,以满足诸如人工智能等关键工作负载的多元化需求。
未来的英特尔至强处理器引入了一种新架构,该架构采用模块化设计方式,通过Fabric技术把模块化die互连,实现灵活的架构,可将独立的计算和I/O的Chiplets(常译为 " 芯粒 "、" 小芯片 ")进行灵活组合,并借助EmiB封装技术实现高带宽和低延迟。基于该架构的模块化SoC包含通用IP、固件、操作系统、平台组件等组件。
基于系统级芯片(SoCs),全新英特尔至强平台具备增强的可扩展性和灵活性,能够提供一系列产品,满足人工智能、云计算和企业应用不断增长的规模、传输和能效需求。这一创新架构亦通过提供两种不同的插槽兼容处理器,使客户能够便捷处理大多数工作负载,且可互换使用,从而为客户提供高性价比。
下一代至强架构具有可扩展性,将提供P核和E核版本,支持1S-8S规格的P核、1S-2S规格的E核。基于这些功能,不同工艺节点之间能够进行匹配,从而得以实现性能和能效的最佳平衡。
得益于I/O和内存子系统的进步,这一架构提供了高性能和平台灵活性的优化,逻辑单片计算集群相较以往的产品提供了更好的每瓦特性能和每线程性能,并为未来代号为Granite Rapids和Sierra Forest的英特尔至强处理器奠定基础。
据悉,英特尔近期出货了第一百万片第四代英特尔至强可扩展处理器,代号为Emerald Rapids的第五代英特尔至强可扩展处理器也将于今年第四季度发布。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
哈佛大学研究团队开发出LangSplatV2系统,实现了超高速3D语言查询功能。该系统通过创新的稀疏编码技术和高效渲染算法,将3D场景语言理解速度提升了47倍,达到每秒384帧的实时处理能力。系统采用全局语义字典和稀疏系数表示,彻底解决了传统方法中解码器速度瓶颈问题,为AR/VR、智能机器人等应用提供了强大的技术基础。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
马里兰大学研究团队提出了CoLa(Chain-of-Layers)方法,让AI模型能够根据任务难度动态调整内部层的使用策略,实现"快思考"和"慢思考"的灵活切换。通过蒙特卡洛树搜索算法,该方法在推理任务上显著提升了模型的准确性和效率,为75%的正确答案找到了更短的处理路径,并纠正了60%的错误答案,为AI模型的架构优化开辟了新方向。