机密计算是一种在处理过程中对数据进行加密的技术,即使在使用过程中也能确保敏感信息的安全,因而迅速流行起来。机密计算将数据隔离在可信执行环境中,这样可以防止未经授权的访问,并为云和多租户环境中的敏感工作负载提供增强的隐私和安全性。由于机密计算弥补了传统加密方法的短板,这种方法在医疗保健和金融等处理关键数据的行业中越来越受欢迎。
正如英特尔在一篇博文中指出的那样,需要组合多个私有数据集的组织可以使用机密计算来执行联合分析或提供机密人工智能服务,这样做不会暴露任何人的私人数据。该功能已用于银行欺诈检测和集体医学研究等领域。
Google Cloud 的新C3实例为Intel Trust Domain Extensions支持的敏感工作负载或受监管数据提供基于硬件的隐私保护和机密性。英特尔TDX是一种基于硬件的技术,通过创建隔离的执行环境来增强数据隐私和安全性,保护敏感工作负载免受未经授权的访问——即使在共享云基础设施中也是如此。使用谷歌云的应用程序可以看到虚拟机中的软件和数据,这些软件和数据与其他云租户中运行的软件以及谷歌的云堆栈、虚拟机管理程序和系统管理员隔离。
英特尔的Xeon可扩展处理器提供对虚拟机的“信任边界”的控制,以及对虚拟机内存的加密(由处理器内部的硬件进一步强制执行)。最终结果是工作负载保持私有,而采用英特尔TDX的机密计算使敏感数据和代码保持私有并且更安全,即使在公共云中也是如此。
Intel Google Cloud Confidential Computing 解决方案还提供可信执行环境的远程认证。该认证为数据相关方提供加密证据,证明其机密虚拟机是真实的,在策略范围内保持更新,并使用经过身份验证的固件启动,从而确保虚拟机正常运行。
客户还可以选择使用 Intel Trust Authority 来认证基于英特尔芯片的机密虚拟机。Intel Trust Authority独立于谷歌云,提供机密虚拟机完整性的独立评估。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。