戴尔今天宣布再次更新PowerEdge服务器产品线,增加了13款采用了英特尔最新第四代Xeon Scalable处理器的新型号。
这些机架式、塔式和多节点的PowerEdge服务器结合了戴尔在工程和软件方面的最新成果,以加速性能并提高跨本地数据中心、公有云和网络边缘计算的可靠性。
英特尔第四代Xeon Scalable CPU是在本月初发布的,据称通过增强的安全性、以及人工智能、云、网络和边缘方面的新功能,在数据中心性能和效率方面实现了重大飞跃。英特尔表示,独特的是,这些新CPU提供了工作负载优先的加速功能,以及针对特定工作负载进行了高度优化的软件,让用户能够在理想的功率水平下发挥出理想的性能,从而优化总拥有成本。
此外,据说第四代Xeon Scalable处理器可以为客户提供一系列管理电源和性能的功能,据称可以优化CPU资源的使用,帮助客户实现可持续发展目标。
今天发布的PowerEdge服务器新品包括PowerEdge HS5610和HS5620系统,旨在帮助云服务提供商管理大规模的、多厂商的数据中心。双路服务器有1U和2U规格可供选择,具有冷通道可维护配置运行Dell Open Server Manager——一个基于OpenBMC的系统,用于简化集群服务器管理。
企业可能会对PowerEdge R760更感兴趣,这是戴尔最新一代基于英特尔CPU的服务器。 由于采用了新的CPU(其中包含Intel Deep Learning Boost和Intel Advanced Matrix扩展),这些服务器运行AI推理的速度提升了2.9倍。
更重要的是,戴尔声称与上一代系统相比,这些新系统的虚拟桌面基础架构性能提升了20%,SAP Sales & Distribution性能提升了50%多。客户可以选择订购配备Nvidia Bluefield-2数据处理单元的PowerEdge R760,提供了额外的卸载、加速和工作负载隔离功能。
戴尔公司总裁、基础设施解决方案事业部总经理Jeff Boudreau表示,企业选择戴尔是因为戴尔提供了易于管理但功能强大、先进和高效的服务器,具有他们处理关键业务工作负载所需的高级功能。他表示:“我们的下一代Dell PowerEdge服务器提供了无与伦比的创新,提高了电源效率、性能和可靠性的标准。”
戴尔表示,通过软件增强功能对服务器管理进行了多项改进。例如,戴尔CloudIQ软件将主动监控与机器学习和预测分析相结合,生成对服务器的全面视图,无论这些服务器在什么位置。该软件目前已经更新,可以提供更好的服务器性能预测和虚拟化可视化功能。
至于戴尔的ProDeploy Factory Configuration服务,它确保了PowerEdge服务器准备就绪可以进行安装,并预配置了客户首选的操作系统、管理程序软件以及RAID、BIOS和iDRAC的设置。戴尔表示,客户还可以使用戴尔ProDeploy机架集成服务,在正在扩展或者正在进行现代化改造的数据中心中安装生产就绪的机架式和联网PowerEdge服务器。
与此同时,戴尔表示,戴尔Dell Remote Access Controller的更新版本可以更轻松地部署和诊断PowerEdge服务,具有Certificate Expiry Notice、Telemetry for Dell Consoles和GPU监控等附加功能。
客户无需购买戴尔最新的PowerEdge服务器即可获得这些新的功能。戴尔表示,戴尔提供这个新的产品阵容以扩展戴尔APEX服务,这让客户能够在“即服务”的基础上使用戴尔最新的硬件,避免因过度配置以满足计算需求而产生的成本。
戴尔表示,今年晚些时候,戴尔将扩展APEX产品组合,以包括本地、边缘或托管设施中的裸机计算服务。然后,客户将能够根据他们特有的工作负载要求选择最佳的服务器配置。戴尔补充说,将以可预测的月度订阅方式提供这些服务器,并通过APEX控制台进行配置简化。
新的PowerEdge R760服务器将于2月在全球范围面市,PowerEdge HD5620和HS5610服务器将于4月上市销售。这些服务器以及今年晚些时候推出的其他新服务器将在2023年下半年通过APEX服务提供。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。