常用的生物识别方法包括人脸识别、指纹识别、虹膜识别、步态识别等。其中,步态识别技术可以通过人的身体体型和行走姿态来辨识身份,它是目前远距离复杂场景下几乎唯一可用于身份识别的生物特征识别技术。银河水滴科技公司(以下简称为“银河水滴”)源自于中科院自动化所,是步态识别技术和产业的引领者。
步态识别面临着极具挑战的复杂环境——远距离、跨视角、跨着装、低照度、全天候,是极具挑战、但又极其重要的科技难题,是公认的当前视频大数据解析与应用的核心技术之一。由于其数据环境复杂,因而所需要处理的数据种类繁多。
为了在步态识别过程中通过深度学习方法处理视角、着装、携带物等多种行人特征的同时,保持所生成步态序列的不变性,银河水滴所需处理的数据量十分庞大,因而 AI 模型的训练数据吞吐量大、整体训练速度偏慢,亟需寻找更强大的 GPU 解决方案以更高效地从步态序列中提取更具鲁棒性的特征。
在步态识别 AI 模型训练中,需要通过 GPU 对大量数据进行传输与计算,NVIDIA DGX-1 所具有的高带宽可以大幅加速数据搬运的过程。DGX-1 是一款深度学习系统,专为实现高吞吐量和高互联带宽而构建,可极大提升神经网络训练性能。其系统核心组件是 8 个 NVIDIA V100 GPU,通过混合立体 NVLink 网络拓扑互联。内置的两块 CPU 以供启动、存储管理及深度学习框架协调之用。DGX-1 内嵌于 3 机架单位(3U)机箱中,集电源、冷却、网络、多系统互联及 SSD 文件系统缓存于一体,各组件相互协调,能够优化吞吐量和深度学习训练时间。通过部署 DGX-1 系统,银河水滴取得了比单独部署 GPU 更强大的性能。
在模型训练过程中银河水滴的技术人员发现,DGX-1 可以协助充分发挥 NVIDIA 数据中心 GPU 的潜力。银河水滴在对其模型进行每 100 次迭代时,此前通过单独采用配置了 8 块 NVIDIA V100 GPU 的服务器所需的训练时间是 2 分 40 秒,而在包含 8 块 V100 数据中心 GPU 的 DGX-1 系统中,这一过程则只需花费 1 分 40 秒,缩短了近 40% 的训练时间。
目前,银河水滴的步态识别技术已在全国各地几十个城市落地,在对步态识别 AI 模型进行训练时,部署了包含 8 块 NVIDIA V100 数据中心 GPU 的 NVIDIA DGX-1 系统,通过强劲算力处理多阶段、多种类、多用途的大量数据,加速了银河水滴步态识别技术的应用落地。DGX-1 系统所具有的革命性 AI 性能也将继续提高银河水滴的 AI 模型训练效率,以助力经过充分迭代的深度学习模型应用至更多场景中。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。