当前,中国数字经济正在加速推进,越来越多的应用是以海量数据为载体,数据成为新型生产要素,推动我们进入新数据时代。
在近日举行的2021腾讯数字生态大会上,英特尔与腾讯共同宣布了一系列深化创新合作成果,围绕数据展开多个维度展开技术协作:构建兼具高性能、大容量的存储产品和多样化数据库,并共同打造可信协同共享,加码数据安全。
面向数据存储和处理的联合创新
数据是企业的核心资产,而海量数据的爆发性增长对于企业的存储基础设施构成了挑战,这表现为内存和存储的容量和密度的持续增加。
在云存储方面,英特尔与腾讯云基于英特尔傲腾持久内存重构和优化腾讯云的极速型固态盘产品——云硬盘(Cloud Block Storage,CBS),其延迟表现非常优秀,非常接近于DRAM,同时拥有持久化特性。
英特尔技术专家指出,与传统DRAM内存相比,由英特尔傲腾技术与其它英特尔先进存储控制技术、接口硬件,以及软件增强功能相结合构建的英特尔傲腾持久内存具有两大显著优势:首先其存储密度更高、单位存储成本更低,可帮助用户更为经济地扩展云存储能力;其次,App Direct 模式下的英特尔傲腾持久内存所具备的持久性特性,使之可以有效充当CBS产品的数据持久化存储载体。
在数据库方面,腾讯云不仅在其全新一代Tendis数据库产品中引入英特尔在内存与存储领域的黑科技—英特尔傲腾持久内存;其企业级分布式数据库产品——TDSQL,在集成第三代英特尔至强可扩展处理器的同时,也基于英特尔傲腾技术进行了基础前沿探索。
其中,高性能分布式KV数据库Tendis引入英特尔傲腾持久内存200系列在性能、容量和持久化等方面的优势,融入冷热数据自动分离等创新技术,目前已可提供存储版、持久内存版、混合存储版三种不同的产品形态。
企业级分布式数据库产品TDSQL集成第三代英特尔至强可扩展处理器,通过其全新架构和高频、多核、多线程的传统优势,大幅提升TDSQL并行处理能力;同时,英特尔傲腾持久内存存储密度更高、单位存储成本更低的特性,也帮助TDSQL的客户更为经济地扩展存储容量,而在App Direct 模式下的英特尔傲腾持久内存具备持久性特性,也可以有效充当Redo日志的数据持久化存储载体。
腾讯云数据库副总经理罗云表示,选择合理介质存储数据,最好的方案是分级存储的冷热分层。也就是对时延比较敏感的热数据采用高成本介质,而对时延比较不敏感的冷数据用低成本介质,让客户能够在成本和性能之间做到一个选择。英特尔傲腾就是这样的产品,它比内存便宜,比磁盘又快得多。
基于此,腾讯云和英特尔进行了深入的合作,比如Tendis利用英特尔傲腾技术完成数据持久化,并解决高效访问数据的问题。”整个DB引擎的设计和傲腾结合非常紧密,可以理解为是围绕傲腾特性打造了我们自己的DB引擎。“罗云说,”底层技术革新可以让我们更好地服务客户,产生新的产品形态。“
化解数据安全与隐私保护之间的矛盾
谈到数据,那么安全和隐私保护始终是不可回避的话题。在保护数据安全方面,英特尔也与腾讯强强联手,旨在通过协同创新,为数据流动与共享建立强大的保护机制。
随着英特尔第三代至强可扩展处理器的发布,一个非常重要的系统功能叫做软件保护扩展(SGX),SGX是一个基于硬件的可信执行环境,对于涉及与CPU交互的数据和代码进行保护,实现机密计算的愿景。
在区块链赋能下,腾讯云打造数据要素共享平台——腾讯云数链通,并在可信执行环境中采用英特尔SGX技术。采用英特尔SGX技术的腾讯云数链通能够为用户提供建立起可信且可溯源的数据交互机制,打破数据壁垒,实现数据融合应用。
腾讯Blade Team技术负责人张博表示,SGX的特点是在计算过程中保证数据的安全,在数链通中,受保护的数据在SGX系统可信执行环境当中进行安全计算。”我们前期调研了机密计算,而SGX是一个很好的技术。“数链通的底层架构基于英特尔的SGX技术,构建了从底层硬件到上层软件栈的整体方案。“
谈及与英特尔的合作,腾讯云数链通产品负责人刘江介绍说,腾讯云探索了多方机密计算的技术,经多方调研和考察后,采用了英特尔的SGX技术,同时结合区块链的分布式账本、共识机制、密码学以及智能合约能力,解决用户在交互、共享过程当中的授权管理和协同计算、隐私安全等问题。
具体来说,通过数链通产品,实现链上数据加密实时共享,链下安全验证可信交换,数据可用而不可见,最大程度的实现数据确权、数据安全、数据共享,最终达到数据可信的目标。
例如在政务应用中,基于隐私计算以及区块链技术,数链通更好地改善政府“一网通办”的数据集中和处理问题,在数据不出域的情况下,基于数据融合计算,把结果给到“一网通办”平台,对于前端用户来说,可以明显感知到整个业务处理过程的效率提升以及减少在整个业务办理过程当中重复信息的提交。
从英特尔和腾讯云的合作,我们看到英特尔SGX技术在云环境下的适应性,基于底层硬件平台,面向虚拟化或者容器环境,让上层应用直接使用硬件级的安全能力,让客户的接入成本更低,从而构建灵活可扩展的软硬件结合的解决方案。
对此,英特尔技术专家指出,目前基于英特尔第三代至强可扩展处理器的SGX 2.0分配给机密计算应用的内容可以达到512G,这样可以满足大数据量的联合分析;支持虚拟化环境部署以及远程认证。而现在攻击处理器的技术发展很快,英特尔不断和业界一起保证CPU,特别是SGX信任根能够提前感知和防护,确保数据安全。
结语
以全栈产品,英特尔与腾讯打造全面、智慧、安全的XPU基础设施平台,并通过软件协同创新和强大的生态体系赋能,满足多元化场景下的复杂工作负载要求。未来,双方将一如既往地全方位深化合作,并持续推动技术创新,以夯实数智未来的坚实基础,加速推动云数智变革。
好文章,需要你的鼓励
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。
这项研究提出了"思想家"(Thinker)任务,一种受人类双重加工理论启发的新型AI训练方法。研究者将问答过程分解为四个阶段:快速思考(严格预算下给出初步答案)、验证(评估初步答案)、慢速思考(深入分析修正错误)和总结(提炼关键步骤)。实验表明,该方法使Qwen2.5-1.5B模型的准确率从24.9%提升至27.9%,DeepSeek-R1-Qwen-1.5B模型从45.9%提升至49.8%。显著的是,仅使用快速思考模式就能达到26.8%的准确率,且消耗更少计算资源,证明了直觉与深度推理作为互补系统的培养价值。
这项由ELLIS研究所和马克斯·普朗克智能系统研究所的科学家进行的研究,揭示了大语言模型安全测试的根本规律:越狱攻击成功率由攻击者与目标模型间的能力差距决定。通过评估500多个攻击者-目标组合,研究团队发现:更强的模型是更好的攻击者;当目标能力超过攻击者时攻击成功率急剧下降;社会科学能力比STEM知识更能预测攻击成功。基于这些发现,研究者建立了预测模型,表明随着AI进步,人类红队测试可能逐渐失效,提示需要发展自动化安全评估方法及更全面地评估模型的说服和操纵能力。
华中科技大学和香港中文大学研究团队提出SATORI-R1,一种通过空间定位和可验证奖励增强多模态推理的新方法。该方法将视觉问答任务分解为图像描述、区域定位和答案预测三个可验证阶段,解决了自由形式推理中注意力分散和训练收敛慢的问题。实验证明,SATORI-R1在七个视觉问答基准上一致提升性能,最高达15.7%,并展示出更聚焦的视觉注意力和更低的训练方差。