2021 年 2 月 24 日,中国北京——为满足现代数据中心发展需求,赛灵思公司(NASDAQ:XLNX)今日宣布推出一系列全新数据中心产品及解决方案,包括全新 Alveo SmartNIC 系列、smart world (智能世界) AI 视频分析应用、一款能够实现亚微秒级交易的加速算法交易参考设计,以及Xilinx App Store (应用商店)。
图:赛灵思全新推出的 Alveo SN100 SmartNIC 系列
从联网和 AI 分析到金融交易,这些当今要求最严苛、最复杂的应用亟需低时延和实时性能。而这一性能水准的实现,始终受限于硬件开发受成本高昂且周期漫长。借助这些全新产品及解决方案,赛灵思正为软件开发者扫清障碍,助其在 Alveo 加速器卡上快速打造和部署软件定义、硬件加速型应用。
赛灵思执行副总裁兼数据中心事业部总经理 Salil Raje 表示:“为了提升网络带宽和针对人工智能与实时分析等工作负载进行优化,数据中心纷纷进行转型。这些复杂、计算密集且持续演进的工作负载正将现有基础设施推向性能极限,并推动了对完全可组合的软件定义硬件加速器的需求。这种加速器提供的灵活应变能力既可以优化现今最严苛的应用,同时,其所提供的灵活性还可以快速适配新型工作负载与协议,并以线速对其进行加速。”
全新 Alveo SN1000 SmartNIC
赛灵思 Alveo SN1000 是业界首个可组合式 SmartNIC 系列,面向各类功能卸载提供了软件定义硬件加速功能。SN1000 SmartNIC 可以直接卸载 CPU 密集型任务,以优化联网性能,其开放架构能以线速为广泛的网络功能提速。
利用 Vitis Networking 平台和 P4、C 和 C++ 等业界标准的高级编程语言,软件开发者可以打造在 SmartNIC 上的硬件里运行的网络功能、协议以及应用。Vitis Networking 使组织机构可以快速、轻松地组合新网络功能与调整现有网络功能,无需更换硬件即可处理新协议和新应用,实现面向未来投资。
SN1000 SmartNIC 能为多种类型的联网、安全和存储卸载提供软件定义的硬件加速功能,例如开放虚拟交换机( Open vSwitch )和虚拟化加速( Virtio.net )。安全卸载包括 IPsec、kTLS 和 SSL/TLS,而加速存储应用则包括 Virtio.blk、NVMe™ over TCP、Ceph 以及压缩和加密业务。
行业支持
——VMware云平台事业部营销副总裁 Lee Caswell
——浪潮集团网络事业部总经理李鹏翀
SN1000 SmartNIC 系列基于赛灵思 16nm UltraScale+ 架构,采用低时延的赛灵思 XCU26 FPGA 和 16 核 Arm 处理器。SN1000 SmartNIC 为 10/25/100Gb/s 连接提供了双 QSFP 端口,其具备领先的小封装性能和 PCIe Gen 4 互联功能。SN1000 采用全高半长外形规格和 75 瓦功率封装。
Alveo SN1022 SmartNIC 将于 2021 年 3 月全面供货。
以全新 AI 视频分析平台构建智能世界
赛灵思正推出一款具有合作伙伴解决方案生态系统的 AI 视频分析平台,以针对最复杂且对时延敏感的 AI 视频推断应用进行加速。由视频机器学习流服务器支持的赛灵思 smart world 平台,可以提供整体应用加速,还能在单个 Alveo 加速器卡上以确定性的低于 100 毫秒的流水线时延支持多个神经网络。其结果就是以业界最低的总拥有成本 ( TCO )支持严苛的 AI 视频分析应用。
赛灵思 smart world 生态系统解决方案已开始供货,包括:
面向全员的低时延电子交易
传统上,在算法交易中实现亚微秒级时延需要经过高成本、高耗时的硬件开发。现在,Vitis 开发平台提供了一款加速算法交易( AAT )参考设计。它令软件开发人员无需开发定制硬件,就能快速且更具成本效益地实现亚微秒交易性能。
AAT 实现在 Alveo 加速器卡上。它提供的模块化设计囊括了一个端到端低时延交易解决方案的全部必需组件。每个模块都能在 Vitis 平台上使用 C 和 C+ 进行定制,以满足每个企业的具体需求。
AAT 参考设计现已向 Alveo 加速器卡客户免费提供。
Xilinx App Store (应用商店)
赛灵思还推出了一个包含诸多可立即部署的加速应用的应用商店,涵盖应用范围从 smart world AI 视频分析到反洗钱和实时视频转码。赛灵思生态系统合作伙伴开发的容器化预构建应用提供了一种简便方法,使得评估、购买和部署加速应用仅需几分钟即可完成。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。