7月30日,此芯科技集团有限公司(以下简称“此芯科技”)AI PC战略暨首款芯片发布会在上海举行,正式推出了其首款专为AI PC打造的异构高能效芯片产品——“此芯P1”。作为国产新一代AI PC算力底座,“此芯P1”不仅异构集成了Arm®v9 CPU核心与Arm Immortalis™ GPU,还搭载了安谋科技(中国)有限公司(以下简称“安谋科技”)“周易”NPU等自研业务产品。凭借高能效的异构算力资源、系统级的安全保障以及强大的技术生态支持,“此芯P1”将更好地满足生成式AI在PC等端侧场景的应用需求。
图1:此芯科技发布首款AI PC芯片
安谋科技销售及商务执行副总裁徐亚涛受邀出席了发布会,对“此芯P1”正式发布表示祝贺的同时,还就国内PC产业的发展以及Arm PC生态建设等议题,与现场嘉宾进行了互动交流。
徐亚涛表示:“在个人计算领域,Arm架构与生成式AI正在推动整个PC行业的新一轮创新。此芯科技是安谋科技的重要合作伙伴,也是国内Arm PC赛道的关键参与者与明星企业。近年来双方携手推动了Arm CPU技术的迭代升级,引领了先进的Armv9架构在PC应用生态中的拓展。此次‘此芯P1’的发布,是双方合作结出的硕果,同时也为Arm PC产业生态注入了全新活力。未来,安谋科技将继续与此芯科技在产品研发、技术生态等多个关键领域保持协作,为产业提供更可靠、高效的算力解决方案,推动终端侧AI在各领域的广泛应用。”
异构算力组合,破局生成式AI算力挑战
当前,随着AI大模型浪潮的持续兴起,PC作为生成式AI的重要载体之一,已成为当下巨头争夺的关键产业高地。然而,生成式AI在对硬件快速赋能的同时,也对其算力、能效以及软硬件协同等方面提出了更高要求。也正因如此,结合各种算力单元的异构计算成为了破局的关键。
图2:此芯科技创始人、CEO孙文剑发布首款异构高能效SoC此芯P1
为了应对生成式AI带来的全新算力与性能挑战,“此芯P1”采用了业界领先的6nm制造工艺,并通过多核异构及专用NPU的设计,集成了Arm Cortex®-A720 CPU、Arm Immortalis-G720 GPU以及安谋科技“周易”NPU等自研业务产品,面向不同场景提供丰富的AI异构计算资源、全方位的安全引擎保障,以及更为卓越的能效表现。
具体而言,基于第三代“周易”架构设计的NPU,作为端侧AI应用的关键算力资源,将为大模型的分布式落地演进提供核心势能。通过对低功耗与高算力的针对性优化,“周易”NPU不仅能够胜任长时间、高负载的任务处理,还支持多核多Cluster的算力扩展。在“周易”NPU的设计上,安谋科技从性能、精度、带宽、调度管理、算子支持等多个维度,对各类图像、视频AI模型算法进行了深度优化,并且完成了对主流大模型的适配,进一步强化其在面对高性能AI计算需求时的表现。
此外,“此芯P1”通过异构集成Arm Cortex-A720 CPU和Arm Immortalis-G720 GPU,使其在通用计算和图形图像加速、渲染等方面具有出色表现。其中,Arm Cortex-A720 CPU作为首款基于Armv9.2架构的64位超高效CPU,能在有限的功耗范围内带来突破的性能表现,并能针对各种计算用例进行优化,特别适用于面向安全与机器学习的消费技术计算领域。Arm Immortalis-G720 GPU则是首款采用Arm全新第五代GPU架构的旗舰产品,通过引入延迟顶点着色(DVS)技术,有效节省功耗并提升帧率,从而实现更高质量的图形表现。
在软件开发层面,“此芯P1”还将引入针对热门AI框架的Arm Kleidi软件库,旨在使开发者能够轻松便捷地在各种设备上获取Arm CPU的出色AI功能。目前,全球范围内从云端到边缘侧的大多数AI推理工作负载都在这些Arm CPU上运行。
创新引领,合作共赢,共促Arm PC生态繁荣
为了更好地推进AI PC产业链建设,发布会期间特别举行了AI PC产业链战略合作启动仪式。安谋科技与此芯科技、联想集团、同方鼎欣、万莫斯、统信软件、麒麟软件、江波龙、百敖软件、无问芯穹等众多合作伙伴携手,将充分发挥各自在IP设计、全栈软件开发以及系统设计等方面的优势,加速国内AI PC创新产品的商业化落地,推动产业实现可持续发展。
图3:AI PC产业链战略合作启动仪式
此外,在发布会的圆桌论坛环节,安谋科技全球服务市场部总经理谢伟与来自此芯科技、联想集团、麒麟软件、阿里云、清昴智能等企业的嘉宾们一道,围绕端侧AI推理的硬件需求与混合式AI的发展、生成式AI对PC软件栈的影响,以及AI PC产业机遇与挑战等核心议题,展开了深入的探讨与交流。
图4:圆桌论坛
历经30余年的创新和深耕,Arm技术已被广泛应用在几乎所有领域的芯片之中,成为全球应用最广泛的计算平台,基于Arm架构的芯片出货量至今已超2800亿颗,覆盖了智能手机、PC、智能汽车、云数据中心等多样化领域。
如今,随着AI大模型在端侧应用的不断扩展,安谋科技作为芯片产业链上游的核心企业,在吸纳和发挥Arm技术和生态优势的基础上,持续深化本土创新实践,自研并推出了NPU、CPU、信息安全、多媒体等产品矩阵。秉持系统化的全局思维,安谋科技积极推动AI架构升级、硬件实现及软件优化,为产业提供坚实可靠的底层算力支持,加速端侧AI在众多行业的落地与应用。
好文章,需要你的鼓励
这篇研究介绍了KVzip,一种创新的查询无关KV缓存压缩方法,通过上下文重建机制为大型语言模型提供高效存储解决方案。该技术能将KV缓存大小减少394倍,同时提高解码速度约2倍,在各种任务上性能几乎不受影响。不同于传统查询相关的压缩方法,KVzip创建可在多种查询场景下重用的通用压缩缓存,特别适合个性化AI助手和企业信息检索系统。研究在LLaMA3.1-8B、Qwen2.5-14B和Gemma3-12B等多种模型上进行了验证,处理长度高达17万词元的文本,并能与KV缓存量化等其他优化技术无缝集成。
腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
这项研究揭示了大型语言模型(LLMs)偏好决策的内在机制。以色列理工学院和IBM研究院的团队开发了一种自动化方法,不需人工预设即可发现和解释影响AI判断的关键概念。研究横跨八个领域(从一般问答到安全评估),分析了12种偏好机制,发现人类评判者重视权威性和清晰度,而AI评判更关注事实准确性。他们提出的层次多领域回归模型不仅能准确预测偏好,还能清晰解释判断过程,为构建更透明、更符合人类价值观的AI系统提供了新途径。