常用的生物识别方法包括人脸识别、指纹识别、虹膜识别、步态识别等。其中,步态识别技术可以通过人的身体体型和行走姿态来辨识身份,它是目前远距离复杂场景下几乎唯一可用于身份识别的生物特征识别技术。银河水滴科技公司(以下简称为“银河水滴”)源自于中科院自动化所,是步态识别技术和产业的引领者。
步态识别面临着极具挑战的复杂环境——远距离、跨视角、跨着装、低照度、全天候,是极具挑战、但又极其重要的科技难题,是公认的当前视频大数据解析与应用的核心技术之一。由于其数据环境复杂,因而所需要处理的数据种类繁多。
为了在步态识别过程中通过深度学习方法处理视角、着装、携带物等多种行人特征的同时,保持所生成步态序列的不变性,银河水滴所需处理的数据量十分庞大,因而 AI 模型的训练数据吞吐量大、整体训练速度偏慢,亟需寻找更强大的 GPU 解决方案以更高效地从步态序列中提取更具鲁棒性的特征。
在步态识别 AI 模型训练中,需要通过 GPU 对大量数据进行传输与计算,NVIDIA DGX-1 所具有的高带宽可以大幅加速数据搬运的过程。DGX-1 是一款深度学习系统,专为实现高吞吐量和高互联带宽而构建,可极大提升神经网络训练性能。其系统核心组件是 8 个 NVIDIA V100 GPU,通过混合立体 NVLink 网络拓扑互联。内置的两块 CPU 以供启动、存储管理及深度学习框架协调之用。DGX-1 内嵌于 3 机架单位(3U)机箱中,集电源、冷却、网络、多系统互联及 SSD 文件系统缓存于一体,各组件相互协调,能够优化吞吐量和深度学习训练时间。通过部署 DGX-1 系统,银河水滴取得了比单独部署 GPU 更强大的性能。
在模型训练过程中银河水滴的技术人员发现,DGX-1 可以协助充分发挥 NVIDIA 数据中心 GPU 的潜力。银河水滴在对其模型进行每 100 次迭代时,此前通过单独采用配置了 8 块 NVIDIA V100 GPU 的服务器所需的训练时间是 2 分 40 秒,而在包含 8 块 V100 数据中心 GPU 的 DGX-1 系统中,这一过程则只需花费 1 分 40 秒,缩短了近 40% 的训练时间。
目前,银河水滴的步态识别技术已在全国各地几十个城市落地,在对步态识别 AI 模型进行训练时,部署了包含 8 块 NVIDIA V100 数据中心 GPU 的 NVIDIA DGX-1 系统,通过强劲算力处理多阶段、多种类、多用途的大量数据,加速了银河水滴步态识别技术的应用落地。DGX-1 系统所具有的革命性 AI 性能也将继续提高银河水滴的 AI 模型训练效率,以助力经过充分迭代的深度学习模型应用至更多场景中。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。