ZD至顶网服务器频道 03月15日 新闻消息(文/邹大斌): 市场需求是技术的最好推动力之一,当自动驾驶、无人飞机市场越来越受关注,需求越来越旺盛,必然推动相关解决方案的升级换代。赛灵思(Xilinx)公司的reVISION就是针对这一市场的最新一代解决方案。
3月13日,赛灵思宣布推出reVISION 堆栈,这是继不久前其发布可重配置加速堆栈加速云端(Cloud) FPGA机器学习主流应用之后,再次将赛灵思技术扩展至终端 ( edge)应用之中, 从而实现了其在机器学习应用领域从端到云的全面部署。reVISION是赛灵思面向视觉导向的机器学习应用领域而打造的一个解决方案,致力于基于其全可编程的SoC平台提供整套目标应用所需的平台、算法和丰富的开发资源,解决80%的设计工作, 让设计者专注于20%自己最有价值的差异化工作, 从而以最快速度开发出最具响应性的自主系统。换而言之, 赛灵思通过全新reVISION使得其基于硬件的全可编程平台,让没有硬件专业知识的人也能快速上手,受益于全可编程技术的各种独特优势。
所谓视觉导向的机器学习应用,主要是指需要视觉引导的自主系统,比如,无人驾驶汽车、无人机、能感应和躲避的机器人、自动监视、自动医疗诊断等。这些也都是目前非常热门的人工智能应用领域,它们都有一些共同的特点,比如对反应时间比较敏感,因而对系统性能要求高。
“这类应用对系统有三大要求:首先必须要有非常快速的响应能力,因为很多应用都是实时的应用,必须能够非常高效地应用算法;第二,要足够灵活,系统要能跟着技术演进。因为机器学习技术变化非常快,一直在不断出现新的神经网络和算法,而且传感器技术也在不断发展;第三,现在是互联的世界,系统需要和其他的机器以及和云实现互联。”赛灵思战略与市场营销部高级副总裁Steve Glaser表示。
Steve Glaser介绍说,目前市场面向这类应用的解决方案主要是嵌入式GPU(如Nvidia Tegra)和典型的SoC(如高通的SoC)。刚刚推出的reVISION与它们相比具有明显的优势。
“以评估系统性能的重要指标之一的图像/秒/瓦为例,reVISION的性能要高出业内最佳的其他选择6倍;而在计算机视觉方面,reVISION更是要胜人一筹。基准的对比显示,reVISION在/秒/瓦这个指标上要比竞争对手高出42倍。”Steve Glaser表示。
可不要小看了这两个指标,它很大程度上决定了系统的整体性能。Steve Glaser解释说,以一辆小汽车跟随在一辆小货车后面为例,这个小货车突然决定紧急停车。如果这个系统响应非常得快,时延非常低的话,可以有效避免碰撞。比如用reVISION,只需要2.7毫秒就可以停止,而即使采用业界最优秀的其他解决方案,可能需要49-320毫秒才能停住。如果汽车的时速是65英里/小时,停车的距离差可能就会从5英尺到33英尺,而其中的差距就是发生事故和没有发生事故的差别。
那么,reVISION为什么会有如此明显的优势?Steve Glaser告诉记者,一个重要原因在于,基于嵌入式GPU和典型的SoC这类解决方案中,需要传输的数据以及需要计算机视频视觉处理和机器学习的数据需要经过外部的存储,而reVISION 则支持数据可以从传感器经过传感器融合到视觉处理、机器学习,甚至到控制,而不需要经过外部存储。这样一方面就提高系统响应速度,同时也保证响应时间是完全可以预知、预测的。
当然,如果再深究其技术根源则可以归于赛灵思所一直倡导的“全可编程(All Programmable)”的理念,也就是不仅软件可编程,硬件也可编程,这种可以综合软件优化能力和硬件高性能的独特优势,也成为包括reVISION在内赛灵思所有解决方案的一个共同竞争优势。
Steve Glaser解释说,通用的CPU+GPU组合虽然软件方面可以编程,在高精度浮点运算时的性能非常好,在训练方面表现很好,但是它们在硬件方面不能重新配置,限制了其性能发挥,使得快速响应和时延方面不太理想,主要用于由研发团队来建设神经中枢的模型,实现训练的高效率,但是不太可能进行嵌入式应用的部署。而嵌入式的GPU和典型的SoC的响应时间虽然有所改善,软件可以重新编程,但是同样硬件也是固定的,不能够重新配置,无法适应新的神经网络和新的传感器类型。
“相比较而言,赛灵思的reVISION不仅能够提供最快速的反应时间,而且还可以重新配置。另外,reVISION还可以支持软件编程,而且是带有行业标准库和框架,这样就能够支持赛灵思器件的广泛采用,实现客户的竞争优势。”Steve Glaser说。
据悉,reVISION可支持最流行的神经网络,包括 AlexNet、GoogLeNet、SqueezeNet、SSD 和 FCN。此外,该堆栈还提供了库元素,包括 CNN 网络层的预定义的优化型实现方案,这也是构建定制神经网(DNN/CNN)所必需的。也正是得益于reVISION能够支持更广泛的嵌入式软件和系统工程师,使其即使没有或者很少硬件设计专业知识也可以使用赛灵思技术更轻松、更快速地开发视觉导向的智能系统。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。