常用的生物识别方法包括人脸识别、指纹识别、虹膜识别、步态识别等。其中,步态识别技术可以通过人的身体体型和行走姿态来辨识身份,它是目前远距离复杂场景下几乎唯一可用于身份识别的生物特征识别技术。银河水滴科技公司(以下简称为“银河水滴”)源自于中科院自动化所,是步态识别技术和产业的引领者。
步态识别面临着极具挑战的复杂环境——远距离、跨视角、跨着装、低照度、全天候,是极具挑战、但又极其重要的科技难题,是公认的当前视频大数据解析与应用的核心技术之一。由于其数据环境复杂,因而所需要处理的数据种类繁多。
为了在步态识别过程中通过深度学习方法处理视角、着装、携带物等多种行人特征的同时,保持所生成步态序列的不变性,银河水滴所需处理的数据量十分庞大,因而 AI 模型的训练数据吞吐量大、整体训练速度偏慢,亟需寻找更强大的 GPU 解决方案以更高效地从步态序列中提取更具鲁棒性的特征。
在步态识别 AI 模型训练中,需要通过 GPU 对大量数据进行传输与计算,NVIDIA DGX-1 所具有的高带宽可以大幅加速数据搬运的过程。DGX-1 是一款深度学习系统,专为实现高吞吐量和高互联带宽而构建,可极大提升神经网络训练性能。其系统核心组件是 8 个 NVIDIA V100 GPU,通过混合立体 NVLink 网络拓扑互联。内置的两块 CPU 以供启动、存储管理及深度学习框架协调之用。DGX-1 内嵌于 3 机架单位(3U)机箱中,集电源、冷却、网络、多系统互联及 SSD 文件系统缓存于一体,各组件相互协调,能够优化吞吐量和深度学习训练时间。通过部署 DGX-1 系统,银河水滴取得了比单独部署 GPU 更强大的性能。
在模型训练过程中银河水滴的技术人员发现,DGX-1 可以协助充分发挥 NVIDIA 数据中心 GPU 的潜力。银河水滴在对其模型进行每 100 次迭代时,此前通过单独采用配置了 8 块 NVIDIA V100 GPU 的服务器所需的训练时间是 2 分 40 秒,而在包含 8 块 V100 数据中心 GPU 的 DGX-1 系统中,这一过程则只需花费 1 分 40 秒,缩短了近 40% 的训练时间。
目前,银河水滴的步态识别技术已在全国各地几十个城市落地,在对步态识别 AI 模型进行训练时,部署了包含 8 块 NVIDIA V100 数据中心 GPU 的 NVIDIA DGX-1 系统,通过强劲算力处理多阶段、多种类、多用途的大量数据,加速了银河水滴步态识别技术的应用落地。DGX-1 系统所具有的革命性 AI 性能也将继续提高银河水滴的 AI 模型训练效率,以助力经过充分迭代的深度学习模型应用至更多场景中。
好文章,需要你的鼓励
Jabra 推出 PanaCast 40 VBS:首款专为小会议室设计的 180° Android 智能音视频一体机
这是一项关于计算机视觉技术突破的研究,由多家知名院校联合完成。研究团队开发了LINO-UniPS系统,能让计算机像人眼一样从不同光照下的照片中准确识别物体真实的表面细节,解决了传统方法只能在特定光照条件下工作的局限性,为虚拟现实、文物保护、工业检测等领域带来重要应用前景。
字节跳动智能创作实验室发布革命性AI视频数据集Phantom-Data,解决视频生成中的"复制粘贴"问题。该数据集包含100万个跨场景身份一致配对,通过三阶段构建流程实现主体检测、多元化检索和身份验证,显著提升文本遵循能力和视频质量。
这篇文章介绍了北京人工智能研究院开发的OmniGen2模型,一个能够同时处理文字转图像、图像编辑和情境生成的全能AI系统。该模型采用双轨制架构,分别处理文本和图像任务,并具备独特的自我反思机制,能够自动检查和改进生成结果。研究团队还开发了专门的数据构建流程和OmniContext评测基准,展现了开源模型的强大潜力。