2023年11月6日,上海——今日,英特尔与星环科技在2023中国国际进口博览会上,联合发布了AIGC向量数据库解决方案,旨在支持多样化机器学习模型生成的海量向量数据,满足企业针对海量向量数据的高实时性查询、检索、召回等需求,为人工智能时代多元化应用场景提供有力支持,为企业业务加速发展提供助力。
英特尔中国软件技术合作事业部总经理唐炯表示,“人工智能技术的高速发展,不仅为全球数字经济注入全新动力,也为企业在多样化业务场景中带来更多全新挑战。深耕人工智能领域多年,英特尔致力于以前瞻性视角,携手生态伙伴一道,通过产品技术创新,打造满足不同业务需求的解决方案,加速大模型应用落地。”
随着大语言模型的发展,生成式AI开始逐渐应用于千行百业,在此过程中,企业对大语言模型解决方案的时效性、准确度等方面的要求逐渐提高,而这也对作为中间载体的向量数据库提出了更高的要求。基于此,星环科技推出基于第四代英特尔®至强®可扩展处理器的Transwarp Hippo分布式向量数据库解决方案。得益于第四代英特尔®至强®可扩展处理器的高内存带宽优势和多核性能优势,该数据库解决方案的灵活性得到显著增强;而VNNI指令集也进一步提升了向量计算的性能。凭借高可用、高性能、易拓展等特性,Transwarp Hippo在大模型场景中,可以极大地拓展大模型的应用边界,让大模型保持信息实时性,并能够动态调整,使大模型拥有“长期记忆”,解决“AI幻觉”的问题。
在万物智能化的数字时代,AI的普及应用带来了生产生活方式的颠覆式创新,而算力和大数据成为了创新发展的重要基础。英特尔将始终基于前沿技术,携手生态伙伴持续贡献“芯”力量,推动数实融合,共赢全球数字经济发展机遇。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。