联想集团今日发布了一系列专为人工智能工作负载优化的数据中心系统。
此次产品发布的重点是名为ThinkSystem SR680a V4的计算设备。据联想介绍,该设备在风冷机箱中集成了近二十个处理器。这些芯片使该设备运行推理工作负载的速度比公司上一代硬件快11倍。
SR680a V4的AI处理能力主要由八块英伟达Blackwell B200显卡提供。B200于去年5月推出,采用四纳米制程工艺,集成了2080亿个晶体管。据英伟达称,该芯片运行万亿参数语言模型时,功耗比上一代芯片降低25%。
SR680a V4的8块显卡由六颗英特尔至强6系列中央处理器提供支持。至强6系列于今年2月推出,包含最多288核心的芯片。该系列还配备了专为加速AI模型而设计的优化功能。其中一项优化功能称为PCT,可在运行高要求工作负载时提升至强6芯片部分核心的性能。
SR680a V4的处理器阵容还包括八块英伟达SuperNIC和该公司的BlueField-3 DPU。这些处理器可从服务器主处理器中分担部分任务,为AI工作负载留出更多计算能力。BlueField-3负责网络安全、存储硬件管理和网络相关任务,而SuperNIC则专注于网络处理。
联想今日还同时发布了另外两款新硬件产品。两款产品均基于其现有ThinkSystem SR675服务器系列。
第一款系统将SR675 V3服务器与思科Nexus交换机系列相结合。该系统最多可配备八块英伟达RTX PRO 6000 Blackwell服务器版显卡。这些芯片基于与B200相同的架构,但并非专门针对AI工作负载。它们包含名为张量光线追踪核心和流式多处理器的电路,专为图形渲染工作负载优化。
联想的第三款新AI系统同样基于SR675服务器系列。该系统专为运行IBM watsonx软件套件而优化,可帮助企业构建AI模型并管理其处理的数据。
这些系统还配套推出了四款新的混合AI优势产品。这些产品包将联想硬件与第三方AI软件相结合。其中一款产品使用计算机视觉模型帮助制造商检测产品缺陷,另一款则面向酒店业。其余两款产品包分别针对工作场所安全和零售应用场景进行优化。
联想还同时推出了全新专业服务套件。该服务名为"AI采用与变革管理服务",承诺简化员工AI工具培训等任务。联想还可帮助企业确保员工负责任地使用这些AI工具。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。