2019年8月29日,北京——在今天举行的2019年百度云智峰会上,英特尔宣布,百度正在为其信息流服务搭建内存数据库,以充分利用大容量、高性能的英特尔傲腾数据中心级持久内存。与第二代英特尔至强可扩展处理器相配合,这一基于英特尔傲腾数据中心级持久内存的全新内存平台将使百度能够降低总体拥有成本,同时为用户提供更加个性化的搜索结果。
英特尔公司副总裁兼云平台与技术事业部总经理Jason Grebe表示:“10余年来,从搜索、人工智能,到自动驾驶和云服务,英特尔和百度一直密切合作,加快百度核心业务发展。我们的深度合作能够快速部署最新的英特尔技术并改善针对百度服务的用户体验。”
如今,在管理爆炸性增长的数据时,百度这样的公司迫切需要快速且高效地访问并存储数据。百度正在推进其信息流服务,以向客户提供更加个性化的内容。
百度使用一种被称为“Feed-Cube”的高级内存数据库,支持其基于云的信息流服务中的数据存储和信息检索。通过部署英特尔傲腾数据中心级持久内存和第二代英特尔至强可扩展处理器,百度能够确保Feed-Cube的高并发性、大容量和高性能,同时降低总体拥有成本(TCO)。
通过密切合作,英特尔和百度架构了混合内存配置,在百度信息流服务中同时采用英特尔傲腾数据中心级持久内存和DRAM。通过这个方案,Feed-Cube在2000万并发访问的压力下将平均访问时间提高了大约24%(30微秒),而CPU利用率只提高了7% 。这些结果在百度可接受的性能浮动范围之内。目前,单服务器DRAM使用量降低了一半以上,这降低了Feed-Cube的PB级存储容量的成本。英特尔和百度已经发布了该案例的详细说明,包括使用英特尔傲腾数据中心级持久内存技术的其它应用,例如Redis、Spark和功能即服务。
百度推荐技术架构部主任架构师汪瑫表示:“通过在Feeb-Cube数据库中采用英特尔傲腾数据中心级持久内存,百度能够节省成本效率,扩展内存容量,并始终能够帮助我们的信息流服务发展。”
英特尔和百度近期还签署了新的合作备忘录,旨在深化双方在百度核心业务领域的合作。百度和英特尔将继续合作以实现新的产品和技术,在日益庞大的核心互联网业务场景以及关键应用和服务方面发挥越来越重要的作用。百度和英特尔的深化合作将帮助百度提供更加多元化和引人入胜的用户体验。
此外,英特尔在百度云智峰会上还公布了两项合作。
好文章,需要你的鼓励
这项由香港中文大学和新加坡国立大学研究者合作开发的"思考或不思考"(TON)框架,通过创新的"思考丢弃"策略和两阶段训练方法,实现了让视觉-语言模型能够像人类一样根据问题难度选择性推理的能力。实验表明,TON可减少高达90%的输出长度,同时保持或提升性能,在计数、数学和导航等多种任务中展现出显著优势,为AI系统在保持推理质量的同时大幅提升效率提供了新思路。
GRIT是一种创新框架,它教会多模态大语言模型(MLLMs)在视觉推理过程中"边看边思考"。传统MLLMs虽能处理图像和文字,但无法明确指出推理时关注的具体图像区域。GRIT通过引入一种新的推理范式,让模型生成的推理内容自然地混合文本和边界框坐标,使AI能像人类一样在思考时明确参考视觉信息。研究团队开发的GRPO-GR强化学习方法不需要详细标注数据,仅用20个训练样本就能赋予模型这种能力。
这项研究提出了SafeKey框架,针对大型推理模型安全问题的新解决方案。研究者发现模型在思考过程中存在"安全啊哈时刻",关键在于理解查询后的第一个句子。SafeKey通过双路径安全头和查询掩码建模两种方法增强这一安全信号,显著提升了模型对越狱攻击的防御能力,平均降低9.6%的有害率,同时保持模型的通用能力。这为AI安全领域提供了新的研究方向。
UC伯克利研究团队开发了Robo2VLM,一个创新框架,利用真实机器人操作数据增强视觉语言模型的空间推理能力。该研究从176K真实机器人轨迹创建了一个包含684,710个问题的大规模VQA数据集,涵盖463个场景和3,396个操作任务。实验表明,这些数据可显著提升模型在空间关系理解、目标推理和物理交互方面的能力,为机器人与AI系统的融合开辟新方向。