作者:MIKE WHEATLEY
更新时间:美东夏令时2023年5月4日09:00
戴尔今天宣布希望新推出的三款托管服务产品能够让应用开发人员和数据科学家的生活更轻松。
这家技术基础设施巨头今天表示,Dell Managed Developer Cloud、Dell Managed Services for MLOps和Colocation with Dell Technologies Services将从今天开始上市。戴尔表示,尽管这三项服务执行的任务各不相同,但是它们的目标都是提高生产力并加速创新。
戴尔认为企业迫切需要提高生产力。它援引了International Data Corp.的研究,表明开发人员真正用于编码的时间不到20%,其他的时间都花在了基础设施管理和等待信息技术资源等方面。与之类似,数据科学家们也面临重重困难,并且在最后毫无进展的项目上浪费了大量的时间。麦肯锡公司的数据表明,只有36%的机器学习项目进行到了模型阶段之后,这也就意味着将近三分之二的项目从来未能进入生产阶段。
戴尔希望解决的另一个挑战是开发机器学习和人工智能的成本问题。对于很多公司来说,接受易于使用的公共云服务是一种巨大的诱惑,但是当他们这样做的时候,很快就会遇到整合现有系统和数据的挑战。
此外,训练大型语言模型需要大量的计算能力和大到令人难以置信的数据集,这意味着成本会迅速增加。这里还存在着隐私问题,因此,更多的企业希望在内部进行人工智能和机器学习开发。然而,为此构建一个私有云带来了新的挑战。
戴尔认为这正是新托管服务的用武之地。Dell Managed Developer Cloud让开发人员可以在基于应用程序编程接口的云环境中使用自助式虚拟机和软件容器。它还提供了内置的基础设施即代码功能,简化对底层服务器和存储基础设施的管理,让开发人员能够将更多的时间用于编码。
Dell Managed Services for MLOps被誉为是一个全面的机器学习模型开发平台,它提供基于戴尔验证设计的集成生命周期管理。它有助于降低部署和维护人工智能和机器学习系统的复杂程度,让数据科学家们可以更快地将他们的模型投入生产。
最后,Colocation with Dell Technologies Service是一项托管服务,帮助开发人员和数据科学家简化云集成工作,利用公司内部系统和数据建立云托管应用程序。戴尔表示,它已经与一系列托管服务提供商达成了协议,确保用户能够灵活选择地点和基础设施。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。