Nvidia的年度GPU Technology Conference大会主题往往都是具有标志性的GPU技术,但是今年GPU不再是唯一受关注的主题。
Nvidia宣布,已经提供了名为BlueField——一种面向数据中心的新型“数据处理单元”——的样品,并计划明年全面上市。
这款芯片致力于应对的挑战是,在现代数据中心中,可用处理能力中很大一部分被用于执行基础设施管理任务,例如扫描网络流量中是否存在恶意软件以及编排存储设备,而BlueField芯片可以接管其中一部分任务,从而释放数据中心的服务器能力,去执行更高价值的任务,以提高整体性能。
这带来的潜在运营收益是巨大的。据Nvidia估计,基础设施管理任务将占数据中心CPU核心处理能力的20%至30%。
Nvidia企业计算部门负责人Manuvir Das在简报会上对记者表示:“我们相信,未来所有服务器中都将采用DPU。”
Nvidia已开始提供的BlueField-2 DPU芯片样品,是网络设备子公司Mellanox共同合作取得的成果。Mellanox在今年早些时候被Nvidia以69亿美元收购之前,就已经开始了这项技术的研究。企业可以通过网络接口控制器(NIC)的形式部署BlueField-2(如图所示),通过行业标准PCIe附加到服务器上。
DPU内部封装了8个基于Arm Cortex-A72架构的CPU核心,这些核心由一对所谓加速引擎(针对网络安全任务进行了优化的专用电路)提供支持。此外Nvidia还提供了功能更强大的第二版DPU称为BlueField-2X,增加了基于Ampere架构的GPU,该架构目前是被Nvidia旗舰GPU所采用的。
Nvidia表示,1个BlueField-2(性能相对较低的版本)可以支持通常需要多达125个CPU核心的基础设施管理任务。
Nvidia计划接下来让DPU变得更加强大,准备推出名为BlueField-3的新产品迭代,然后是BlueField-4,但不会像当前型号那样具有独立的GPU和CPU电路,而是一个集成芯片。Nvidia表示,目标是在2023年交付BlueField-4,面向人工智能工作负载的性能将实现每秒400万亿次操作。
Nvidia首席执行官黄仁勋在今天举行的在线大会上表示:“我们将为网络领域带来大量技术。短短几年内,我们的计算吞吐量将增加近1000倍。”
BlueField当前和未来的迭代都将运行DOCA软件开发套件,企业可以使用该套件来开发芯片应用,它包括了用于与电路、示例代码、文档、库和构建DPU软件所需的其他组件进行交互的编程接口。
Nvidia网络部门产品营销总监Ariel Kit在博客中写道:“DOCA为你提供了一套可靠的统一工具,以开发在DPU上运行的关键数据中心服务,处理多种类型的数据处理,包括引导网络流量;加速、虚拟化和压缩存储;加密和解密数据;扫描安全威胁;集成远程管理工具;在Arm核心上运行控制平面应用。”
Nvidia正在采取措施推广BlueField。上周,VMware宣布与Nvidia达成合作伙伴关系,在VMware Cloud Foundation中采用DPU来创建下一代架构,更好地满足AI、机器学习、高吞吐量、以数据为中心的应用的独特需求。
BlueField产品线让Nvidia从GPU扩张到数据中心芯片市场的其他领域提供了更多的深度,Nvidia在今年早些时候收购的Mellanox是另一个关键因素。最近Nvidia还提出以400亿美元收购Arm,这是迄今为止Nvidia在这方面最大的赌注。Arm的芯片设计遍布于智能手机到数据中心存储设备和网络设备的绝大多数产品中。
好文章,需要你的鼓励
OpenAI、Anthropic和Google的AI代码助手现在能够在人工监督下连续工作数小时,编写完整应用、运行测试并修复错误。但这些工具并非万能,可能会让软件项目变得复杂。AI代码助手的核心是大语言模型,通过多个LLM协作完成任务。由于存在上下文限制和"注意力预算"问题,系统采用上下文压缩和多代理架构来应对。使用时需要良好的软件开发实践,避免"氛围编程",确保代码质量和安全性。研究显示经验丰富的开发者使用AI工具可能反而效率降低。
Prime Intellect团队发布开源AI训练全栈INTELLECT-3,这个106亿参数模型在数学、编程等测试中超越多个大型前沿模型。团队完全开源了包括prime-rl训练框架、环境库、代码执行系统在内的完整基础设施,为AI研究社区提供了高质量的训练工具,推动AI技术民主化发展。
英伟达与AI芯片竞争对手Groq达成非独家授权协议,将聘请Groq创始人乔纳森·罗斯、总裁桑尼·马德拉等员工。据CNBC报道,英伟达以200亿美元收购Groq资产,但英伟达澄清这并非公司收购。Groq开发的LPU语言处理单元声称运行大语言模型速度快10倍,能耗仅为十分之一。该公司今年9月融资7.5亿美元,估值69亿美元,为超200万开发者的AI应用提供支持。
港科大研究团队开发ORCA框架,首次让视频头像具备真正的"主观能动性"。通过"观察-思考-行动-反思"循环机制和双系统架构,虚拟角色能够自主完成复杂多步骤任务,在L-IVA测试平台上达到71%成功率。这项技术突破了传统视频生成只能机械执行预设动作的限制,为虚拟主播、教育视频等应用开辟新前景。