机器学习和数据分析等数据密集型工作负载已变得司空见惯。为处理这些计算密集型任务,企业需要为实现高性能进行优化的加速服务器。
英特尔于昨日发布第3代英特尔至强可扩展处理器(代号“Ice Lake”)。该处理器基于全新的架构,可大幅提升其性能和可扩展性。在NVIDIA GPU和网络功能的帮助下,新系统成为理想的企业加速计算平台。此外,新系统还具备可实现GPU加速应用的功能。

Ice Lake平台加速计算的优势
Ice Lake采用了PCIe Gen 4,其数据传输速率比前代产品增加了一倍,现在已经可以与基于NVIDIA Ampere架构的GPU(如NVIDIA A100 Tensor Core GPU)的原生速度相匹配。PCIe Gen 4的采用提高了与GPU间的吞吐量,这对于涉及大量训练数据的机器学习工作负载来说尤为重要。同时,PCIe Gen 4的采用也提高了数据密集型任务的传输速度,比如通过高性能NVIDIA A40数据中心GPU等加速的NVIDIA RTX虚拟工作站3D设计任务。
PCIe性能的提高加快了GPU直接内存访问的传输速度。GPU和采用GPUDirect视频技术的设备之间视频数据I/O通信速度的加快,可助力实现更强大的直播解决方案。
数据速率的提高还实现了200Gb/s的网络速度,例如NVIDIA ConnectX家族的HDR 200Gb/s InfiniBand网卡、200Gb/s以太网网卡,以及即将推出的NDR 400Gb/s InfiniBand网卡技术。
Ice Lake平台支持64条PCIe通道,因此可以在同一台服务器中安装更多的硬件加速器,包括GPU和网卡等,从而提高每台主机的加速密度。这也意味着由最新NVIDIA GPU和NVIDIA 虚拟PC软件加速的多媒体VDI环境可以实现更高的用户密度。
这些增强功能实现了前所未有的GPU加速扩展。企业可以通过在一台主机内使用更多的GPU并更加有效地连接多台主机的GPU,处理最大规模的工作。
英特尔还提高了Ice Lake内存子系统的性能,将DDR4内存通道数从6条增加到8条,使内存的最高数据传输速率达到3200MHz。这使得从主内存到GPU和网络的数据传输带宽变得更大,进而可提高数据密集型工作负载的吞吐量。
最后,处理器本身的改进也进一步加快了计算工作负载的速度。每个时钟周期的指令数增加10-15%,可使加速工作负载所对应的CPU部分整体性能提升多达40%。此外,核的数量也有所增加,比如8xxx系列中的核心多达40个。这将提高每台主机的虚拟桌面会话密度,进一步增加服务器GPU投资的回报。
NVIDIA十分高兴地看到合作伙伴发布由NVIDIA GPU加速的全新Ice Lake系统,用于包括戴尔科技专为GPU加速而打造的Dell EMC PowerEdge R750xa,以及基于第3代英特尔至强可扩展处理器和PCIe Gen4打造的全新联想ThinkSystem服务器(其中有多个型号搭载NVIDIA GPU)。
英特尔的全新Ice Lake平台及随附的加速器硬件非常适合准备更新数据中心的企业客户。全新架构的增强功能使企业能够运行性能更加出色的数据中心级加速应用。NVIDIA与英特尔的共同客户将能够迅速从中获益。
敬请访问NVIDIA认证服务器目录,查看采用Ice Lake CPU的GPU加速服务器型号列表。后续将会有更多系统加入,欢迎定期访问该目录。
好文章,需要你的鼓励
全球数据中心建设需求持续高涨。北美方面,美国数据中心建设支出年化达510亿美元,微软在威斯康星州开放33亿美元设施,亚马逊和谷歌宣布在密苏里州合计投资250亿美元。欧洲方面,SoftBank将在法国建设5GW AI数据中心,投资额达750亿欧元。亚太地区,AirTrunk计划在印度投资210亿美元建设3GW数据中心。中东与非洲地区也有多项大规模项目落地。
这项研究提出Epi2Diff方法,通过将大型推理模型的解题思考过程拆解为认知片段序列,提取过程特征预测考题对人类的难度,在四个真实考试数据集上超越了所有对比基线。
随着企业将AI融入机器人、工业设备等物理基础设施,边云协同架构正成为关键课题。以Luminous Robotics和先正达为例:前者在太阳能农场部署的机器人每秒做出10次决策,数据定期上传云端持续优化模型;后者通过Cropwise平台整合卫星、无人机、拖拉机传感器数据,辅助农民完成约150项农业决策。两家公司均强调,边缘端负责实时响应,云端负责模型训练与更新,同时保持人工监督以确保安全与准确性。
南京大学与阿里巴巴提出MIMFlow,将掩码图像建模与标准化流端到端融合,让生成模型专注语义建模,以更少参数和更少令牌在ImageNet上取得FID 2.50的优异表现。