集成了x86、Vega 图形、XDNA AI 和 FPGA 电路的Arm真是太棒了!
作者:Tobias Mann
更新时间:协调世界时2024年2月7日星期三21:53
AMD昨天推出了Embedded+架构,此举提出了一个问题:既然可以拥有五个计算架构,为什么还要选择一个呢?
AMD的最新产品通过PCIe将x64 Ryzen处理器与Versal AI Edge 片上系统结合,让它们可以在网络边缘等低功耗、低延迟数据处理应用的单板上使用。
主处理器可以从Ryzen Embedded R2000系列中挑选,该系列于2022年推出,拥有多达4个Zen+ CPU内核、16个PCIe 3.0 通道和多达8个 Radeon Vega图形计算单元。
该芯片有一个专用的PCIe链路,连接到AMD Versal自适应SoC,前者于2021年首次出现。这些Versal器件包含一系列AI引擎、一个FPGA和四个Arm设计的CPU内核(两个Cortex-A72和两个Cortex-R5)。在ML处理方面,AMD声称其顶级Versal芯片能够在INT8上实现约228 TOPS。
正如Embedded+这个名字所示,这种技术应该应用在相对恶劣条件下经久耐用的设备中——公共显示器、现场仪器和机械、网络边缘处理、运输和汽车等。它不见得非常尖端或者非常强大;可靠性、成本、功耗性能比、占用空间和特定工作负载验证通常更为重要。因此,可以预计这些芯片会使用较旧的架构。
事实上,AMD将目光投向了工业机器人、零售和监控安全、智慧城市设备、网络、机器视觉和医学成像;其客户会判断该硬件的延迟、特质和处理管道是否适合其应用。
AMD的工业视觉、医疗保健和科学市场高级总监Chetan Khona在一份声明中侃侃而谈:“在自动化系统中,传感器数据的价值会随着时间的推移递减,并且必须尽可能使用最新鲜的信息进行操作,以实现最低延迟的确定性响应。在工业和医疗应用中,需要在毫秒级别做出许多决策。”
为了达到这些延迟目标,AMD鼓励开发人员将工作负载分解为更小的部分,这些部分可以通过平台的各种计算架构单独加速。例如,自适应SoC的FPGA和AI引擎可对来自多个传感器或馈送的流数据进行预处理和分类,而Ryzen处理器的CPU和GPU内核则运行控制系统和图形用户界面。
当然,混合内核系统一直是这样处理的,AMD并不是第一个将混合架构置于一块板上甚至单个芯片中的公司。这是显而易见的。有趣的是,AMD不仅在Ryzen和Versal系列中采用了这种做法,还非常强调嵌入式和网络边缘端的AI,如果人们不需要,它就不会这样做。理论上如此。
在首批基于AMD Embedded+设计的系统中,Sapphire的Edge+ VPR-4616-MB非常有创意。它将四核Ryzen嵌入式R2314处理器连接到mini-ITX规格的主板上的Versal AI Edge VE2302 Adaptive SoC,据报道,该主板的功耗低至30瓦。Sapphire还计划为该主板配备内存、存储、PSU和机箱,成为完全组装的计算机。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。