常用的生物识别方法包括人脸识别、指纹识别、虹膜识别、步态识别等。其中,步态识别技术可以通过人的身体体型和行走姿态来辨识身份,它是目前远距离复杂场景下几乎唯一可用于身份识别的生物特征识别技术。银河水滴科技公司(以下简称为“银河水滴”)源自于中科院自动化所,是步态识别技术和产业的引领者。
步态识别面临着极具挑战的复杂环境——远距离、跨视角、跨着装、低照度、全天候,是极具挑战、但又极其重要的科技难题,是公认的当前视频大数据解析与应用的核心技术之一。由于其数据环境复杂,因而所需要处理的数据种类繁多。
为了在步态识别过程中通过深度学习方法处理视角、着装、携带物等多种行人特征的同时,保持所生成步态序列的不变性,银河水滴所需处理的数据量十分庞大,因而 AI 模型的训练数据吞吐量大、整体训练速度偏慢,亟需寻找更强大的 GPU 解决方案以更高效地从步态序列中提取更具鲁棒性的特征。
在步态识别 AI 模型训练中,需要通过 GPU 对大量数据进行传输与计算,NVIDIA DGX-1 所具有的高带宽可以大幅加速数据搬运的过程。DGX-1 是一款深度学习系统,专为实现高吞吐量和高互联带宽而构建,可极大提升神经网络训练性能。其系统核心组件是 8 个 NVIDIA V100 GPU,通过混合立体 NVLink 网络拓扑互联。内置的两块 CPU 以供启动、存储管理及深度学习框架协调之用。DGX-1 内嵌于 3 机架单位(3U)机箱中,集电源、冷却、网络、多系统互联及 SSD 文件系统缓存于一体,各组件相互协调,能够优化吞吐量和深度学习训练时间。通过部署 DGX-1 系统,银河水滴取得了比单独部署 GPU 更强大的性能。
在模型训练过程中银河水滴的技术人员发现,DGX-1 可以协助充分发挥 NVIDIA 数据中心 GPU 的潜力。银河水滴在对其模型进行每 100 次迭代时,此前通过单独采用配置了 8 块 NVIDIA V100 GPU 的服务器所需的训练时间是 2 分 40 秒,而在包含 8 块 V100 数据中心 GPU 的 DGX-1 系统中,这一过程则只需花费 1 分 40 秒,缩短了近 40% 的训练时间。
目前,银河水滴的步态识别技术已在全国各地几十个城市落地,在对步态识别 AI 模型进行训练时,部署了包含 8 块 NVIDIA V100 数据中心 GPU 的 NVIDIA DGX-1 系统,通过强劲算力处理多阶段、多种类、多用途的大量数据,加速了银河水滴步态识别技术的应用落地。DGX-1 系统所具有的革命性 AI 性能也将继续提高银河水滴的 AI 模型训练效率,以助力经过充分迭代的深度学习模型应用至更多场景中。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。