戴尔今天宣布推出了两个针对人工智能和高性能计算工作负载的系统家族,采用了VMware今天同步发布的一项名为vSphere Bitfusion的图形卡虚拟化技术。
这两个系统家族分别命名为Dell EMC Ready Solutions for AI和Dell EMC Ready Solutions for vHPC,已经从今天开始全面上市。
Dell EMC Ready Solutions for AI结合了PowerEdge服务器、Nvidia图形卡、Isilon F800全闪存文件存储系统以及网络设备,企业可以根据需要定制组件。戴尔提供了四种可供选择的Nvidia图形处理单元,从RTX工作站级图形卡,到功能更强大的V100数据中心芯片,以及多种服务器和网络交换机型号。
每个系统均随附VMware软件,以帮助企业管理硬件组件。软件捆绑包中包括VMware旗舰虚拟化平台最新版本vSphere 7和VMware Cloud Foundation,从而可以在使用Kubernetes在容器中运行AI工作负载。最值得注意的是一项名为vSphere Bitfusion的新功能,可以通过虚拟化Nvidia芯片从而发挥更大价值。
VMware去年收购了位于美国奥斯汀的Bitfusion.io初创公司,其软件平台通过减少GPU闲置提高企业AI基础设施的效率。Bitfusion虚拟化了GPU,从而让主机服务器闲置的图形卡计算能力可以被其他服务器使用,以提高利用率。
VMware已经以vSphere Bitfusion的形式将Bitfusion的技术整合到vSphere中了,vSphere Enterprise Plus许可提供了该功能。
VMware产品营销经理Michael Adams在博客中写道:“现在GPU可以跨网络得到有效的利用,最大限度地提高利用率,这意味着就可以像多年前共享CPU那样共享GPU了,从而避免资源利用效率低下的孤岛问题。”
除了Dell EMC Ready Solutions for AI之外,戴尔还推出了Dell EMC Ready Solutions for vHPC下的一些新功能。Dell EMC Ready Solutions for vHPC系统也可以用于运行机器学习工作负载,只是侧重点有所不同。
Dell EMC Ready Solutions for vHPC顾名思义,用于满足高性能计算工作负载(例如经常运行在超级计算机上的科学模拟)的需求,这种工作负载也经常使用AI。据戴尔称,该系统配备了vSphere 7和Bitfusion意味着它比传统HPC硬件更易于管理,因为许多IT团队已经熟悉使用vSphere来管理基础设施。
戴尔服务器和基础设施系统部门总裁Arthur Lewis在博客文章中提供了有关这些系统的更多详细信息。“为了优化解决方案性能,工程团队针对两种最常见的高性能计算工作负载(并行分布式应用(MPI)和实际吞吐量工作负载)打造了解决方案,MPI应用可用于天气预报和分子建模等领域。实际吞吐量工作负载可用于财务风险分析的蒙特卡洛模拟、数字电影渲染和基因组学分析。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。