VMware发布对vSphere套件的重大更新,戴尔随之在加速器方面做出回应。

戴尔认为,使用其旧有服务器的客户也应该有机会运行数据处理单元(DPU,又名SmartNIC)。这类设备将网络硬件与充足的计算和存储资源结合起来,可以运行加密等杂务,借此释放CPU核心以更高效地处理关键负载。
这家本地硬件厂商上周宣布将推出“Customer Kits”,可用于在第15代PowerEdge服务器(于2021年推出)中安装加速器。戴尔最新的第16代PowerEdge服务器已经于今年早些时候与广大用户见面。
DPU属于PCIe设备,因此在旧服务器上的安装应该不会太过复杂。戴尔没有介绍新套件的样式,也未提及为什么需要额外套件才能接入DPU。
但该套件的存在本身却意义重大。除非您身在超大规模企业,否则目前使用DPU的唯一简单方法就是在VMware的旗舰vSphere 8套件下运行,借助其中提供的“分布式服务引擎”来管理设备及运行其上的工作负载。
VMware此前曾经向媒体证实,其客户并不急于采用DPU,原因就是只有新服务器能够支持,所以打算等下一波硬件更新之后再行考虑。但虚拟巨头提到,旧有服务器其实很快就能支持DPU设备。
没错,戴尔已经用实际行动证明了这个结论。他们甚至表示,已经有部分DPU使用到Arm架构的处理器,其运行功耗更低、能够“压低运营成本并促进可持续性”。
我们也期待首批在旧有戴尔服务器上运行DPU的朋友尽快分享自己的使用感受。
就在戴尔放出消息的同一天,VMware也宣布将对vSphere 8进行第二次更新。
此版本的一大新增功能,就是迅速更新了vCenter——这是VMware着力开发的生命周期管理方案,希望帮助客户轻松对虚拟机组和混合云服务器进行更新和升级管理。VMware目前已经将此视为研发工作的优先事项,看重的自然是其背后的深远意义。
此外,另一项值得关注的更新是在身份联动选项中引入了Microsoft Entra Active Directory(以前称为 Azure AD)。VMware称此举可以减少vCenter的攻击面,允许用户通过Entra来替代直接在VMware设备内复制身份服务。
此次更新还改进了GPU共享能力。这一点非常重要,因为目前GPU产品供应短缺,因此关注AI研发的组织必须想办法把现有GPU有效利用起来。
VMware的软件定义存储产品VSAN也迎来了升级,进一步将存储和计算加以拆分(https://docs.vmware.com/en/VMware-vSphere/8.0/rn/vmware-vsan-802-release-notes/index.html)。
感兴趣的朋友可以参考完整的vSphere 8 Update 2发布说明(https://docs.vmware.com/en/VMware-vSphere/8.0/rn/vsphere-vcenter-server-802-release-notes/index.html),以及VMware工作人员做出的讲解和讨论(https://www.youtube.com/watch?v=J-MunOaZohs,视频)。
还有一条消息,富士通已经在vSphere 8之下认证了其DPU服务器。与这家日本科技巨头一同宣布支持的还有HPE和戴尔。但如前文所述,只有戴尔宣称可在旧有服务器上运行DPU。
好文章,需要你的鼓励
根据Gartner最新报告,微软凭借广泛的合作伙伴和平台生态系统在企业级AI领域占据主导地位,而谷歌凭借集成的AI代理技术栈和可扩展的企业采用支持在企业代理AI方面领先。报告涵盖近30个AI技术竞赛领域,包括数据基础设施、模型代理、行业解决方案和网络安全等类别。尽管科技巨头投入数十亿资金扩展AI基础设施,但企业仍在努力证明AI技术的商业价值,超过三分之二的企业困于生成式AI试点阶段。
微软亚洲研究院与清华大学联合提出双向感知塑造技术,通过创新的两阶段训练方法解决AI视觉理解中的关键问题。该技术让AI学会正确聚焦重要视觉信息,避免被无关内容误导。仅用1.3万训练样本就在八个基准测试中平均提升8.2%性能,超越使用数十万样本的专门模型,为AI视觉推理能力提升开辟新路径。
美国国家标准与技术研究院发布人工智能网络安全框架配置文件草案,旨在帮助组织安全使用AI系统。该文件围绕"安全"、"防御"和"阻止"三个重点领域,详细说明如何管理不同AI系统的网络安全挑战、利用AI增强网络防御能力以及阻止AI驱动的网络攻击。文件将网络安全框架的各个组件映射到具体建议上,覆盖入侵检测到供应链安全等各个方面。
上海交通大学研究团队开发了TimeBill框架,解决大语言模型在实时应用中的时间不确定性问题。该系统通过精确预测回答长度和执行时间,动态调整AI记忆管理策略,确保在规定时间内完成任务的同时保持回答质量。实验显示TimeBill在各种时间预算下都能实现最佳的完成率与性能平衡,为AI在自动驾驶、工业控制等安全关键领域的应用提供了重要技术支撑。