2023年11月6日,上海——今日,英特尔与星环科技在2023中国国际进口博览会上,联合发布了AIGC向量数据库解决方案,旨在支持多样化机器学习模型生成的海量向量数据,满足企业针对海量向量数据的高实时性查询、检索、召回等需求,为人工智能时代多元化应用场景提供有力支持,为企业业务加速发展提供助力。
英特尔中国软件技术合作事业部总经理唐炯表示,“人工智能技术的高速发展,不仅为全球数字经济注入全新动力,也为企业在多样化业务场景中带来更多全新挑战。深耕人工智能领域多年,英特尔致力于以前瞻性视角,携手生态伙伴一道,通过产品技术创新,打造满足不同业务需求的解决方案,加速大模型应用落地。”
随着大语言模型的发展,生成式AI开始逐渐应用于千行百业,在此过程中,企业对大语言模型解决方案的时效性、准确度等方面的要求逐渐提高,而这也对作为中间载体的向量数据库提出了更高的要求。基于此,星环科技推出基于第四代英特尔®至强®可扩展处理器的Transwarp Hippo分布式向量数据库解决方案。得益于第四代英特尔®至强®可扩展处理器的高内存带宽优势和多核性能优势,该数据库解决方案的灵活性得到显著增强;而VNNI指令集也进一步提升了向量计算的性能。凭借高可用、高性能、易拓展等特性,Transwarp Hippo在大模型场景中,可以极大地拓展大模型的应用边界,让大模型保持信息实时性,并能够动态调整,使大模型拥有“长期记忆”,解决“AI幻觉”的问题。
在万物智能化的数字时代,AI的普及应用带来了生产生活方式的颠覆式创新,而算力和大数据成为了创新发展的重要基础。英特尔将始终基于前沿技术,携手生态伙伴持续贡献“芯”力量,推动数实融合,共赢全球数字经济发展机遇。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。