VMware发布对vSphere套件的重大更新,戴尔随之在加速器方面做出回应。

戴尔认为,使用其旧有服务器的客户也应该有机会运行数据处理单元(DPU,又名SmartNIC)。这类设备将网络硬件与充足的计算和存储资源结合起来,可以运行加密等杂务,借此释放CPU核心以更高效地处理关键负载。
这家本地硬件厂商上周宣布将推出“Customer Kits”,可用于在第15代PowerEdge服务器(于2021年推出)中安装加速器。戴尔最新的第16代PowerEdge服务器已经于今年早些时候与广大用户见面。
DPU属于PCIe设备,因此在旧服务器上的安装应该不会太过复杂。戴尔没有介绍新套件的样式,也未提及为什么需要额外套件才能接入DPU。
但该套件的存在本身却意义重大。除非您身在超大规模企业,否则目前使用DPU的唯一简单方法就是在VMware的旗舰vSphere 8套件下运行,借助其中提供的“分布式服务引擎”来管理设备及运行其上的工作负载。
VMware此前曾经向媒体证实,其客户并不急于采用DPU,原因就是只有新服务器能够支持,所以打算等下一波硬件更新之后再行考虑。但虚拟巨头提到,旧有服务器其实很快就能支持DPU设备。
没错,戴尔已经用实际行动证明了这个结论。他们甚至表示,已经有部分DPU使用到Arm架构的处理器,其运行功耗更低、能够“压低运营成本并促进可持续性”。
我们也期待首批在旧有戴尔服务器上运行DPU的朋友尽快分享自己的使用感受。
就在戴尔放出消息的同一天,VMware也宣布将对vSphere 8进行第二次更新。
此版本的一大新增功能,就是迅速更新了vCenter——这是VMware着力开发的生命周期管理方案,希望帮助客户轻松对虚拟机组和混合云服务器进行更新和升级管理。VMware目前已经将此视为研发工作的优先事项,看重的自然是其背后的深远意义。
此外,另一项值得关注的更新是在身份联动选项中引入了Microsoft Entra Active Directory(以前称为 Azure AD)。VMware称此举可以减少vCenter的攻击面,允许用户通过Entra来替代直接在VMware设备内复制身份服务。
此次更新还改进了GPU共享能力。这一点非常重要,因为目前GPU产品供应短缺,因此关注AI研发的组织必须想办法把现有GPU有效利用起来。
VMware的软件定义存储产品VSAN也迎来了升级,进一步将存储和计算加以拆分(https://docs.vmware.com/en/VMware-vSphere/8.0/rn/vmware-vsan-802-release-notes/index.html)。
感兴趣的朋友可以参考完整的vSphere 8 Update 2发布说明(https://docs.vmware.com/en/VMware-vSphere/8.0/rn/vsphere-vcenter-server-802-release-notes/index.html),以及VMware工作人员做出的讲解和讨论(https://www.youtube.com/watch?v=J-MunOaZohs,视频)。
还有一条消息,富士通已经在vSphere 8之下认证了其DPU服务器。与这家日本科技巨头一同宣布支持的还有HPE和戴尔。但如前文所述,只有戴尔宣称可在旧有服务器上运行DPU。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。