2019年8月29日,北京——在今天举行的2019年百度云智峰会上,英特尔宣布,百度正在为其信息流服务搭建内存数据库,以充分利用大容量、高性能的英特尔傲腾数据中心级持久内存。与第二代英特尔至强可扩展处理器相配合,这一基于英特尔傲腾数据中心级持久内存的全新内存平台将使百度能够降低总体拥有成本,同时为用户提供更加个性化的搜索结果。
英特尔公司副总裁兼云平台与技术事业部总经理Jason Grebe表示:“10余年来,从搜索、人工智能,到自动驾驶和云服务,英特尔和百度一直密切合作,加快百度核心业务发展。我们的深度合作能够快速部署最新的英特尔技术并改善针对百度服务的用户体验。”
如今,在管理爆炸性增长的数据时,百度这样的公司迫切需要快速且高效地访问并存储数据。百度正在推进其信息流服务,以向客户提供更加个性化的内容。
百度使用一种被称为“Feed-Cube”的高级内存数据库,支持其基于云的信息流服务中的数据存储和信息检索。通过部署英特尔傲腾数据中心级持久内存和第二代英特尔至强可扩展处理器,百度能够确保Feed-Cube的高并发性、大容量和高性能,同时降低总体拥有成本(TCO)。
通过密切合作,英特尔和百度架构了混合内存配置,在百度信息流服务中同时采用英特尔傲腾数据中心级持久内存和DRAM。通过这个方案,Feed-Cube在2000万并发访问的压力下将平均访问时间提高了大约24%(30微秒),而CPU利用率只提高了7% 。这些结果在百度可接受的性能浮动范围之内。目前,单服务器DRAM使用量降低了一半以上,这降低了Feed-Cube的PB级存储容量的成本。英特尔和百度已经发布了该案例的详细说明,包括使用英特尔傲腾数据中心级持久内存技术的其它应用,例如Redis、Spark和功能即服务。
百度推荐技术架构部主任架构师汪瑫表示:“通过在Feeb-Cube数据库中采用英特尔傲腾数据中心级持久内存,百度能够节省成本效率,扩展内存容量,并始终能够帮助我们的信息流服务发展。”
英特尔和百度近期还签署了新的合作备忘录,旨在深化双方在百度核心业务领域的合作。百度和英特尔将继续合作以实现新的产品和技术,在日益庞大的核心互联网业务场景以及关键应用和服务方面发挥越来越重要的作用。百度和英特尔的深化合作将帮助百度提供更加多元化和引人入胜的用户体验。
此外,英特尔在百度云智峰会上还公布了两项合作。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。