2019年12月3日,北京——今日,以“数智·未来”为主题的2019中国数据与存储峰会在北京成功举办。汇聚全球数据存储领域知名的专家学者、企业领军人物与代表性企业用户,本次峰会旨在帮助企业和社会提升数据智能水平,推动全球存储与数据产业发展。英特尔公司中国区非易失性存储事业部总经理刘钢先生出席大会并发表演讲,不仅从产品层面阐述了英特尔如何通过傲腾技术和QLC NAND技术填补当前存储层级中的巨大鸿沟,还通过诸多用户案例进一步展示英特尔如何通过内存与存储的产品、技术创新引领存储新架构,构建数据金字塔。
在演讲中刘钢先生指出,随着海量数据汹涌而至,当前的数据量基本以每三年两倍的速度快速增长。同时,Redis、Spark等新的应用对数据的存储能力也提出更高要求,早期“存储金字塔”中的DRAM、NAND、HDD存储介质由于容量、时延和带宽三个层面的问题已经无法满足新应用及海量数据存储需求。基于此,英特尔傲腾技术和英特尔QLC NAND技术旨在通过弥合内存与存储层级结构中成本和性能差距,扩大内存容量并提升NAND响应速度,帮助企业消除制约数据流动和数据处理方面的瓶颈。此外,英特尔将于明年在业内率先推出用于数据中心级固态盘的144层QLC(四级单元)NAND,以进一步提升数据响应速度,满足以数据为中心的计算需求。
在坚定推动内存与存储技术创新之外,英特尔亦不断深化与本地合作伙伴在存储领域的合作。近日,英特尔和浪潮便联合宣布双方将共同开发以傲腾最新的双端口NVMe SSD作为高速缓存的全闪存储平台,以提高整体存储平台的性能,提升用户应用的效率。此外,双方还将基于金融、交通、政府、能源等不同行业背景联合推出行业场景化解决方案,共同推动以英特尔傲腾SSD为代表的创新存储技术在企业级存储系统中的应用与推广。
内存与存储作为英特尔六大技术支柱的重要组成部分,当前已成为英特尔面向以数据为中心时代的战略性基础设施。面对未来海量数据不断爆发的趋势,英特尔将不断通过内存和存储层级结构中的突破性创新,帮助企业更加高效地处理数据,并提升从数据中获取洞察的能力,从而让数据真正发挥价值。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。