AMD近日推出了一款新的数据中心加速卡Alveo MA35D,帮助流媒体提供商等企业更高效地处理视频。
MA35D是AMD早期产品Alveo U30的后续产品。MA35D可以同时处理32个1080p视频流,是之前的4倍,同时功耗更低。据报道,AMD内部测试表明,MA35D“通常功耗”要比Alveo U30低66%。
流媒体提供商不会以原始形式向用户分发视频内容,而是打包成压缩文件格式。以压缩格式存储视频占用的存储空间更少,因此,可以以带宽效率更高的方式通过网络发送,从而降低成本。
更改视频流文件格式的任务称为编码。AMD新推出的MA35D加速卡专为执行编码而设计,此外还可以执行将视频流转换回原始文件格式的解码任务。
加速卡是一种计算模块,将一个或者多个芯片封装到比标准服务器还小的机箱中。AMD表示,8个MA35D加速卡可以集成到一台标准的单机架服务器中。一台配备8个MA35D加速卡的设备可以管理多达256个并行视频流。
Alveo MA35D的大部分处理能力是由两个板载芯片提供,也就是AMD所谓的VPU。这是使用5纳米工艺制造的专用集成电路(ASIC)。ASIC是一种定制芯片,可以运行特定类型的工作负载。
针对特定工作负载优化处理器可以使其速度更快。如果应用频繁执行乘法,工程师可以构建具有大量乘法优化电路的芯片,这样的芯片比没有那么多专用电路的、更通用的处理器性能更高。
为AMD的新加速器提供动力的VPU等ASIC,是从零开始构建的,用于运行一种类型的工作负载。ASIC要比FPGA更符合应用的要求,后者是另一种常用于此类任务的芯片。AMD的MA35D加速卡采用完全基于ASIC的设计,而上一代Alveo U30采用的是速度较慢的FPGA。
AMD AECG数据中心事业部总经理Dan Gibbons表示:“我们和我们的客户以及合作伙伴密切合作,不仅要了解他们的技术要求,还要了解他们在部署大容量交互式流媒体服务以实现盈利方面所面临的基础设施挑战。我们开发了具有ASIC架构的Alveo MA35D,可满足这些供应商的定制需求,降低资本和运营支出。”
除了两个ASIC驱动的VPU之外,MA35D还具有其他计算模块,其中一个是AI引擎,每秒可以执行高达22万亿次的运算。据AMD称,该引擎运行AI模型,可以自动提高视频流的质量并压缩视频流以节省带宽。
AMD目前正在向早期客户提供MA35D样品,计划在第三季度开始大批量出货。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。