虚拟化软件公司VMware正在考虑与最大竞争对手之一微软结盟,此举可能对其共同客户产生一些积极的影响。
两家公司多年来一直是竞争对手,都提供相互竞争的服务,旨在帮助那些希望将关键工作负载迁移到云中的客户管理私有数据中心。
但是用户抱怨的一个问题是,他们始终很难在微软Azure云上运行VMware的虚拟化软件(允许不同的操作系统和多个应用运行在同一台物理计算机上)。这是一个很大的问题,因为这限制了VMware客户的选择,其中很多VMware客户希望利用混合云基础设施让他们在何处部署应用有更多的选择。
现在,这个情况即将改变,正如今天The Information报道的,两家公司正在探索类似于VMware在2016年与AWS签署的合作协议,该协议的成果是一项名为VMware Cloud on AWS的新服务,让企业能够在Amazon云上轻松运行VMware软件,以及利用AWS云。
The Information称,VMware和微软正在开发能够让企业轻松将VMware应用迁移到Azure云的软件。虽然让VMware虚拟化服务器运行在Azure中是可行的,但做需要大量的技术工作。VMware与微软展开任何合作应该都会让这变得容易一些。
双方的合作无疑是客户需求的结果。The Information在报道中称:“VMware首席执行官Pat Gelsinger去年6月告诉CNBC,他的客户要求提供VMware软件与Azure以及Google Cloud之间的兼容性。”
Constellation Research分析师Holger Mueller表示,客户明确表示他们希望VMware软件能够与所有领先的云基础架构即服务运营商展开合作。
Mueller说:“VMware认为它已经找到了一个长期生存的可行策略,提供混合云控制平面和其他基于云的服务。客户希望有多个选择,VMware希望复制与AWS的合作,与微软,也许还有谷歌。”
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。