8月25日,在无锡举办的“第二届中国集成电路设计创新大会暨 IC 应用博览会(ICDIA 2022)高峰论坛上,安谋科技产品研发负责人刘澍表示,随着软件定义硬件成为未来的发展趋势,各种场景化的软件增加了系统的碎片化和复杂度,CPU、GPU、NPU以及ISP、VPU等计算单元构成的异构融合计算平台,将能够在各种碎片化场景中,对计算的差异化需求提供有效解决方案。安谋科技在立足全球生态、本土创新的基础上,将自研IP和Arm IP打造成一体化、高质量的异构计算平台,助力本土产业持续创新。
软件定义硬件时代,异构计算解决复杂场景问题
AI、5G等飞速发展的技术给我们的生活带来了巨大的便利性和高效性,随之而来的是成本以及软件复杂度的大幅增加。以汽车为例,一辆燃油车的技术成本约为2000美元,其中软件成本约为10%;混动汽车的技术成本约为1.5万美元,其中软件成本占比提高到20%;而在L5级别的自动驾驶汽车中,技术成本则将达到近4万美元,软件部分占比将高达50%。技术成本以及软件成本占比的提升,意味着两者的重要性越来越高,并影响到整个系统以及硬件的设计。同样,在服务器市场也显示出软件定义硬件的趋势,例如容器技术、虚拟化技术、微服务技术等带来的软件定义计算、软件定义网络、软件定义存储等。 “未来软件定义硬件的趋势会从云发展到边缘,进而发展到端侧。”刘澍表示。
随着软件定义硬件成为趋势,多种算法不断涌现,场景化的软件增加了系统的碎片化和复杂度。例如在拍照优化这个应用场景中,需要用RGB图像深度抠图、背景虚化后再进行超分处理,最终显示出符合需求的高质量图片。在这个处理过程背后,硬件方面涉及到CPU和ISP的协同以及GPU和NPU的协同,乃至SoC中各个异构计算的协同和配合。
在谈及如何应对场景碎片化、多样化的问题时,刘澍表示:“碎片化的场景更需要异构计算核心的配合,不仅需要CPU、GPU等通用计算单元,也需要高质量的人工智能处理单元NPU,视频图像处理单元VPU、ISP或是其它安全处理功能。通过各个计算单元之间的异构融合和协同工作,来满足复杂场景对计算的差异化需求。”
评估系统真实需求,为客户提供满足真实应用场景的设计
面对越来越复杂的碎片化场景,如何满足硬件上的需求?答案是需要评估系统真实的需求。刘澍指出,通用的Benchmark无法代表真实场景的需求。以自动驾驶场景分析为例,用一个赛道上简单的几辆车在运行的场景,通过车速来判断真实的性能需求显然不够准确,因为真实的城市交通场景是非常复杂的,存在着交通指示、人和各种各样的物体之间大量的交互。
为评估系统的真实需求,安谋科技提出了基于场景的分析办法,对游戏、编解码、安全等客户关心的关键场景进行分析和提取,分化出CPU、GPU的工作量以及NPU、VPU等其它异构核心单元的工作量。通过对各计算单元工作量的评估,进而得到性能模型和功耗模型进一步分析,进而通过对带宽、功耗、性能的分析最终达到最优化的系统设计。”刘澍介绍到。
“通过Total Compute对系统级异构的分析,结合客户的应用分析出真实需求,从而定义出满足真实复杂场景的系统设计和芯片设计方案。”刘澍指出,基于Arm的开发工具、分析工具以及强大的软件生态,我们为客户提供相关的驱动、软件以及分析工具,还可以通过物理库产品,为CPU、GPU定制最优的PPA物理实现所需要的基础单元。 “Total Compute方案已经得到了很多国内合作伙伴的深度参与。例如,通过Total Compute分析,游戏开发引擎取得了内存带宽节省30%的成果,这对提升性能和减少功耗以及对芯片的成本节省都有很大的提升。”刘澍表示。
构建多元异构计算平台,助力客户加速产品开发
据刘澍介绍,安谋科技的自研IP和Arm产品形成了完整的 异构核心计算矩阵。除了Arm CPU、GPU等通用计算IP外,安谋科技 “周易”NPU、“星辰”CPU、“山海”SPU以及“玲珑”ISP和VPU等自研IP产品在异构计算中同样是不可或缺的核心。刘澍表示: “安谋科技自研IP和Arm IP,追求的是一体化的、完整的异构计算的矩阵。在这个矩阵下,各个计算单元通过协同和互补形成一个完整的平台。安谋科技将持续致力于异构计算产品研发,为客户提供多元化的、满足实际场景需求的解决方案。”
数据显示,自安谋科技成立以来,在国内的授权合作伙伴超过300家,累计芯片出货量突破250亿片,促进了下游年产值过万亿元人民币规模的科技产业发展,这也是安谋科技在整个Arm生态里所做出的重要贡献。“我们希望通过Arm生态助力本土芯片产业,欢迎更多的合作伙伴加入到Arm生态中来。”刘澍总结道。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。