苏州泛科特机器人公司 CTO & 知乎 UP 主袁博融硕士毕业于多特蒙德工业大学电气工程与信息技术专业,深耕机器人及自动化等领域,同时也是 NVIDIA 的忠实用户,在 Jetson 开发者突破百万这一里程碑时刻,袁博融老师分享了他使用 NVIDIA Jetson 进行开发的故事与经验。
初识 NVIDIA Jetson 平台
袁博融老师是在硕士毕业前才接触 NVIDIA Jetson 的。那时刚完成论文答辩,有了些空闲时间,便趁着教育优惠还没到期入手了一套 NVIDIA Jetson TX1。
袁博融老师表示一开始也没有明确的开发目标,只是当一个和树莓派差不多的实验平台进行操作。但使用下来,他发现 Jetson 的配置显然比树莓派好得多,有 GPU 和 CUDA,还有 Ubuntu 系统,可以做 ROS 开发。在这一使用阶段,他在 Jetson 上面安装了 Jupyter,主要是用 OpenAI Gym 跑强化学习,做 RealSense 相机的测试。那时候在 Jetson上装 librealsense 还需要重新编译内核,现在已经方便多了。在这块板子上他学会了使用 TensorRT,见识到了其在 AI 应用上的潜力。后来有了 TX2 和 Jetson Nano,这块板子的使命就结束了。
NVIDIA 在 Jetson 系统上做了很长时间的积累。Jetson 所使用的 Tegra SoC,初代产品 Tegra APX 2500 在 2008 年就已经发布,甚至比 GeForce 100 系还早。而 Jetson 平台的第一代产品 TK1 则在此 6 年之后才推出。他后来还收藏了搭载 Tegra K1 的 Yellowstone 平板,其性能不输 Jetson Nano。
上图是谷歌为 Tango 项目所开发的套件,发布于 2014 年。除了性能强大之外,它还搭载了 IMU,鱼眼相机,以及基于结构光的深度相机。即便系统几年前已不再更新,现在仍能在上面运行最新版的 RTAB-Map,可作为 VSLAM 开发的参考。Tango 项目实际只持续了 5 年,但极大促进了移动设备在环境感知、3D 重建、室内导航及增强现实等领域的技术发展,也为之后的 ARCore 奠定了基础。
NVIDIA Jetson 平台
成为机器人开发的好帮手
最近一两年,袁老师和他的团队的开发主要基于 Jetson Nano 和 Xavier NX,这两款模块具有较高的性价比与相互兼容的引脚设计。袁老师在知乎专栏中也和大家分享了一些有意思的应用,比如自制 3D 相机和运行 AI 围棋,这些都得益于 Jetson 强大的通用算力。
另外由于其小尺寸低功耗和兼容引脚设计,甚至还能用来做一些更加不同寻常的应用。比如矽递科技推出了 Jetson Mate 载板,可以同时搭载 4 块 Jetson Nano 或 Xavier NX。于是他也使用 4 块 Xavier NX 搭建了一台 Jetson 集群,还在其中设法嵌入了一个小尺寸无线路由。借助这台集群,可以方便地进行很多技术试验,比如 K8S 和 MinIO,MPI 并行计算,还有 ROS2 的 DDS 通信测试。
作为机器人开发者,为了方便进行 SLAM 开发和测试,袁老师和他的团队搭建了一套手持 SLAM 平台。上面搭载了 Livox 激光雷达、GigE 相机、GNSS 模块、电池和触摸屏,使用 Xavier NX 作为主控。Xavier NX 不仅可以满足整套 SLAM 系统的实时运算,还为传感器提供了 PTP 同步服务。
袁老师及团队还在开发一款使用 Xavier NX 作为主控的托盘搬运机器人。与众不同的是,他们在这台机器人上使用 DreamVu 的 PAL 全景深度相机作为主传感器。值得一提的是,DreamVu 也是 NVIDIA 生态圈的合作伙伴之一。两个团队正在一起为托盘搬运机器人开发更好且更具性价比的感知方案。
使用单个 PAL 相机就能实现 360° 的水平感知与 110° 的垂直感知覆盖,消除了所有盲区,这是其它传感器所无法提供的。而其得以实现也离不开 NVIDIA Jetson 的算力支持。使用单块 Xavier NX,就可以实时完成图像矫正、深度估计、目标检测,以及可通行区域检测。
不可错过的 NVIDIA Jetson 平台
随着更多的开发者加入,以及大家对 Jetson 平台有了更深的了解,袁老师及团队还将进一步挖掘其潜力。Jetson 最独特的优势在于提供了强大的通用算力。在机器人领域除了 AI 算法,还有很多算法可以并行化,这些都可以在 Jetson 上使用 GPU 或专有电路加速。NVIDIA 也提供 Isaac 平台以方便进行机器人应用开发。当 Orin 平台带来更强算力后,机器人领域也可能出现新的技术革命,相信我们很快就能见证全新一代机器人的出现。
“作为一名早期开发者,很开心看到 Jetson 系列在这几年内飞速发展,成为边缘计算领域最具吸引力的平台,让开发者们的各种奇思妙想得以实现。”袁老师表达了自己对于 NVIDIA Jetson 平台迅速发展的祝贺。
*本文中图片均由知乎 UP 主袁博融提供,如果您有任何疑问或需要使用本文中图片,请联系袁博融。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。