戴尔虽然不再拥有VMware,但是这两家厂商还在一如既往地密切合作,共同设计了他们今天在VMware Explore 2022上公布的一系列新数据中心基础设施系统。
戴尔表示,此次发布的这些新系统以及戴尔APEX基础设施即服务产品组合更新,旨在通过提高运行在这些环境中运行的应用性能,来帮助企业拥抱多云和边缘计算战略。戴尔基础设施解决方案集团总裁Jeff Boudreau表示,这是因为客户一直在寻求帮助能够简化他们多云和边缘战略的方案,因此戴尔给出了回应。
所以,戴尔和VMware展开密切合作,设计了一系列新的VxRail系统,运行VMware最新版本的旗舰虚拟化软件vSphere 8。VxRail是一种超融合基础设施系统,把存储、计算和网络捆绑到一个设备中。此次更新是在这些系统中加入了特殊的“数据处理单元”,使其在处理信息方面比标准的CPU和GPU更加高效。
戴尔认为,采用这种专用芯片是至关重要的,因为vSphere 8已经进行了重新架构可以运行在DPU之上,这让客户可以看到出色的应用和网络性能,以及更低的总体拥有成本。此外,新推出的VxRail系统还支持VMware新的vSAN企业存储架构,提供更高效的存储,而且尺寸也比上一代系统更小,非常适合部署在医院、工厂和工业设施等边缘位置。
VMware高级副总裁、云基础设施总经理Krish Prasad表示,企业对软件定义网络和存储基础设施的需求给传统CPU带来了很大压力。
他解释说:“随着更多分布式、资源密集型应用的加入,我们需要对数据中心架构进行重构,以完全支持这些应用的要求。Dell VxRail with VMware vSphere 8将通过在DPU上运行基础设施服务,为下一代数据中心架构奠定基础。”
这款新系统将于今年晚些时候在全球上市,客户可以直接购买,或者通过戴尔APEX基础架构即服务业务根据资源使用情况付费的方式使用该系统。为了让客户有充分的理由考虑在VMware环境中使用戴尔APEX产品组合,戴尔还推出了一系列更新。
例如,Dell APEX Cloud Services with VMware Cloud现在支持托管的VMware Tanzu Kubernetes Grid服务,戴尔表示,该服务非常适合于那些希望采用容器应用开发方法的开发人员。借助戴尔托管的Tanzu服务,客户将能够直接通过vSphere用户界面配置Kubernetes集群。
与此同时,APEX Private Cloud和APEX Hybrid Cloud现在都提供了新的“仅计算”选项,允许客户独立扩展他们的计算资源和存储资源,从而提供了更大的灵活性。
最后戴尔宣布推出了一项名为Dell Validated Designs for AI - Automatic Machine Learning的新服务,据称该服务依靠自动化机器学习模型来帮助数据科学家构建人工智能驱动的应用,捆绑了很多经过测试和验证的Dell VxRail超融合基础设施配置,包含了很多特定选项可以运行来自VMware、H20.ai和Nvidia的AI开发软件。据戴尔称,客户可以使用这些系统来加快洞察和创建新AI模型,速度提高了18倍。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。