作为全球人工智能计算领导者,NVIDIA携手合作伙伴亮相2017中国国际社会公共安全博览会(CPSE 2017),并展示NVIDIA Metropolis全新端到云的智慧城市解决方案。
视频是全球最大的数据生成源,它们来自政府资产、公共交通、商业楼宇和道路等领域中部署的数亿台摄像机。至2020年,摄像机的累计数量预计将增加至约10亿台。视频及数据的采集让城市变得“可视化”,而智能数据分析推理才赋予城市真正的“智慧”,进而为城市安全保驾护航。
在处理城市建设中的海量数据方面,AI比人力更擅长。由深度学习驱动的AI计算机能够颠覆传统数据处理、分析的方式,高效整合海量图像信息并将其转化为深层次的理解。
从数据采集,存储,处理到推理运用,城市视频监控分析人员每日面临复杂挑战。以往单纯依靠人员监控的方式仅能覆盖视频监控数据的凤毛麟角,而早期视频分析系统的处理能力正确度远远低于人类。
NVIDIA Metropolis智慧城市平台将GPU深度学习及加速、推理能力应用于城市安防系统中,可以实现视频数据的实时处理,并不断通过训练推理,提高性能,让每一次数据采集都赋予意义。
Metropolis是一个涵盖训练和推理,从端到云的AI城市整体解决方案。它在数据中心和云端整合了NVIDIA Tesla加速计算平台,在终端整合了Jetson嵌入式平台;软件层面则通过TensorRT、DeepStream、JetPack等帮助开发者实现优化加速、视频处理和推理提升。
目前正式发布的Metropolis版本中,包含了DeepStream SDK,简化了由深度学习提供支持的、用于AI城市与超大规模数据中心的可扩展智能视频分析的开发工作。它将用于推理的NVIDIA TensorRT,用于转换的视频编解码SDK,以及所有需要的预处理和数据管理整合成为一套优化的API。开发者可以使用DeepStream来进行图像分类、场景理解、视频归类、内容过滤等,以满足最严苛的吞吐与延迟的需求。
此外,Metropolis还包含打造Jetson平台的开发套件JetPack。对于批量大小(Batch Size)为1的低延迟应用程序,JetPack 3.1版本可将其深度学习推理性能提高一倍。这些解决方案都能帮助开发者更高效地在终端构建AI应用。
目前,NVIDIA Metropolis平台越来越多地被用于安防领域,从改善交通与停车,到增强执法效力,再到提升城市服务等方面,让城市安全变得更加有“深度”。
在中国,NVIDIA已经与阿里巴巴、海康威视、华为、大华、宇视、商汤科技、旷视、依图科技、东方网力、佳都科技等厂商携手,推出了覆盖视频分析、人脸识别、智慧交通等领域的安防解决方案,不断让GPU的强大处理能力渗透至城市安防的各个领域。
NVIDIA亚太区战略运营与合作伙伴副总裁潘迪表示,“NVIDIA在安防领域提供端到云,从训练到推理的人工智能整体解决方案,NVIDIA Metropolis将GPU的强大性能提供给城市安全领域的合作伙伴,并共同引领安防行业的新变革”。
目前,NVIDIA在安防领域的核心合作伙伴已经超过50家,并不断拓展中,越来越多的企业正在使用NVIDIA Metropolis平台,来共同打造更安全、更智慧的城市。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。