集成了x86、Vega 图形、XDNA AI 和 FPGA 电路的Arm真是太棒了!
作者:Tobias Mann
更新时间:协调世界时2024年2月7日星期三21:53
AMD昨天推出了Embedded+架构,此举提出了一个问题:既然可以拥有五个计算架构,为什么还要选择一个呢?
AMD的最新产品通过PCIe将x64 Ryzen处理器与Versal AI Edge 片上系统结合,让它们可以在网络边缘等低功耗、低延迟数据处理应用的单板上使用。
主处理器可以从Ryzen Embedded R2000系列中挑选,该系列于2022年推出,拥有多达4个Zen+ CPU内核、16个PCIe 3.0 通道和多达8个 Radeon Vega图形计算单元。
该芯片有一个专用的PCIe链路,连接到AMD Versal自适应SoC,前者于2021年首次出现。这些Versal器件包含一系列AI引擎、一个FPGA和四个Arm设计的CPU内核(两个Cortex-A72和两个Cortex-R5)。在ML处理方面,AMD声称其顶级Versal芯片能够在INT8上实现约228 TOPS。
正如Embedded+这个名字所示,这种技术应该应用在相对恶劣条件下经久耐用的设备中——公共显示器、现场仪器和机械、网络边缘处理、运输和汽车等。它不见得非常尖端或者非常强大;可靠性、成本、功耗性能比、占用空间和特定工作负载验证通常更为重要。因此,可以预计这些芯片会使用较旧的架构。
事实上,AMD将目光投向了工业机器人、零售和监控安全、智慧城市设备、网络、机器视觉和医学成像;其客户会判断该硬件的延迟、特质和处理管道是否适合其应用。
AMD的工业视觉、医疗保健和科学市场高级总监Chetan Khona在一份声明中侃侃而谈:“在自动化系统中,传感器数据的价值会随着时间的推移递减,并且必须尽可能使用最新鲜的信息进行操作,以实现最低延迟的确定性响应。在工业和医疗应用中,需要在毫秒级别做出许多决策。”
为了达到这些延迟目标,AMD鼓励开发人员将工作负载分解为更小的部分,这些部分可以通过平台的各种计算架构单独加速。例如,自适应SoC的FPGA和AI引擎可对来自多个传感器或馈送的流数据进行预处理和分类,而Ryzen处理器的CPU和GPU内核则运行控制系统和图形用户界面。
当然,混合内核系统一直是这样处理的,AMD并不是第一个将混合架构置于一块板上甚至单个芯片中的公司。这是显而易见的。有趣的是,AMD不仅在Ryzen和Versal系列中采用了这种做法,还非常强调嵌入式和网络边缘端的AI,如果人们不需要,它就不会这样做。理论上如此。
在首批基于AMD Embedded+设计的系统中,Sapphire的Edge+ VPR-4616-MB非常有创意。它将四核Ryzen嵌入式R2314处理器连接到mini-ITX规格的主板上的Versal AI Edge VE2302 Adaptive SoC,据报道,该主板的功耗低至30瓦。Sapphire还计划为该主板配备内存、存储、PSU和机箱,成为完全组装的计算机。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。