VMware最近宣布了一项收购计划,旨在使旗舰vSphere虚拟化平台能够更好地运行人工智能应用。
近日VMware宣布计划收购Bitfusion.io,后者是一家拥有四年历史的人工智能基础设施虚拟化软件厂商,它的技术是基于许多与vSphere相同的理念。
虚拟化是一种让数据中心设备更高效的方法,这种技术让管理员能够将硬件资源(如存储容量和处理能力)与底层服务器分离,从而实现更高的操作灵活性,反过来也可以让基础设施团队大幅减少闲置的硬件资源。
Bitfusion的软件产品FlexDirect主要用于对企业用于运行人工智能模型所使用的芯片进行虚拟化。FlexDirect适用于GPU、FPGA和ASIC,这也是机器学习最常用的三种处理器类型。FlexDirect为企业使用的AI应用提供处理能力,最大限度发挥芯片的性能。
“该平台可以在虚拟化基础架构中共享GPU,作为一组网络可访问的资源而不是每台服务器上的孤岛资源,”VMware云平台业务部门负责人Krish Prasad在宣布收购Bitfusion的博客文章中这样写道。
Prasad详细说明了VMware将把FlexDirect集成到vSphere中的细节,其目标是帮助客户更好地利用附加到虚拟化服务器的AI芯片。FlexDirect还可以与基于云的机器学习基础设施配合使用,这一点特别符合VMware的产品战略。
“从很多方面来看,Bitfusion为VMware多年来给计算领域提供的功能提供了硬件加速。Bitfusion还与VMware的‘任何云、任何应用、任何设备’愿景保持一致,能够跨越AI框架、云、网络和虚拟机和容器等技术。”
Bitfusion的团队将参与到产品整合的工作中。在此次收购之前,Bitfusion已经从包括三星和FPGA厂商Xilinx在内的投资方那里筹集了800多万美元的资金。
这次收购的财务条款尚未披露。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。