今年315,人脸识别系统问题曝光,在我们震惊上亿人脸信息被窃取遭泄露的同时,也看到在合法、合规的前提下,企业业务数字化、智能化发展巨大应用前景。如何做到合法合规?首先,信息采集需征得所有者同意,其次采集信息需在边缘及时处理甚至加密,从而避免被第三方非法获取。这就对物联网设备的数据采集提出了更高的要求。
因此,自适应计算企业赛灵思( NASDAQ: XLNX )宣布面向市场扩展其 UltraScale+ 产品组合,以支持需要超紧凑及智能边缘解决方案的新型应用。新款 Artix 和 Zynq UltraScale+ 器件的外形尺寸较传统芯片封装缩小了70%,能够满足工业、视觉、医疗、广播、消费、汽车和互联市场等更广泛的应用领域。
作为全球唯一基于16纳米技术的成本优化型产品组合,UltraScale+ 器件采用台积电最先进的InFO(Integrated Fan Out,集成扇出)封装技术。借助InFO技术,UltraScale+ 器件能以紧凑的封装提供高计算密度、出色的性能功耗比以及可扩展性,从而应对智能边缘应用的需求。
赛灵思产品线管理与营销高级总监 Sumit Shah 表示:“对紧凑型智能边缘应用的需求正推升对处理和带宽引擎的需求。这些引擎不仅要提供更高的性能,还要提供更高级别的计算密度,以支持最小尺寸的系统。UltraScale+ 系列的新款成本优化型产品分别是专为高 I/O 带宽和 DSP 计算而打造的Artix UltraScale+ FPGA;专为功耗和成本而优化的Zynq UltraScale+ MPSoC;可扩展且安全的 Artix和 Zynq UltraScale+。
Artix UltraScale+ FPGA:专为高 I/O 带宽和 DSP 计算而打造
Artix UltraScale+系列基于业经生产验证的FPGA架构,是一系列应用的理想选择。例如,搭载高级传感器技术的机器视觉、高速互联以及超紧凑“8K 就绪”视频广播。Artix UltraScale+ 器件提供了每秒 16Gb 的收发器,可以支持互联、视觉和视频领域的新兴高端协议,与此同时还能实现同类最佳的 DSP 计算功能。
Zynq UltraScale+ MPSoC:专为功耗和成本而优化
成本优化Zynq UltraScale+ MPSoC 针对边缘连接及工业和医疗物联网系统所设计,包括嵌入式视觉摄像头、AV-over-IP 4K和8K 就绪流媒体、手持测试设备,以及消费和医疗应用等。并采用基于异构 Arm 处理器的多核处理器子系统,同时还能迁移至普通封装尺寸以支持更高算力。
可扩展且安全的 Artix和 Zynq UltraScale+
安全性是赛灵思设计中的关键组成部分。此次推出的成本优化型 Artix 和 Zynq UltraScale+ 系列的新款器件都具备同样健全的安全功能,包括 RSA-4096 认证、AES-CGM 解密、数据保护法( DPA ),以及赛灵思专有的 Security Monitor (SecMon,安全监测)IP,能够灵活应对产品生命周期中的安全威胁,满足商业项目的各种安全需求。
正是由于赛思灵 UltraScale+ 系列新款器件向用户提供出高性能、高带宽、低功能、高安全等诸多特性,极大促进了企业数字化转型的顺利进行,就好像 LUCID Vision Labs 创始人兼总裁 Rod Barman 所说的:“LUCID 与赛灵思紧密协作,将新款 UltraScale+ ZU3 集成到我们的下一代工业机器视觉摄像头 Triton™ Edge 中。借助 UltraScale+ ZU3 及其 InFO 封装,LUCID 能利用创新的软硬结合板(rigid-flex board)架构,将惊人的处理能力压缩于工厂级坚固的超紧凑 IP67 摄像头中。”
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。