Jetbot系列13-图像回归法实现循路功能

前一篇从Jetson Projects所挑选的“TRANSFER LEARNING WITH JETBOT & TRAFFIC CONES”项目，是延续避撞应用使用深度学习的图像分类技术，让Jetbot实现循路的功能，这种“定速”类型的操作基本上比较偏向于“找路”或“走迷宫”的应用。

前一篇从Jetson Projects所挑选的“TRANSFER LEARNING WITH JETBOT & TRAFFIC CONES”项目，是延续避撞应用使用深度学习的图像分类技术，让Jetbot实现循路的功能，这种“定速”类型的操作基本上比较偏向于“找路”或“走迷宫”的应用。

如果要面向“赛道”类的竞速型的循路应用，那么Jetbot范例中的road_following项目会更加适合，这个项目使用图像回归(Image Regression)的深度学习技术，是一种统计学上非常有用的数学模型。

回归分析(Regression Analysis)在大数据分析中是一种预测性的建模技术，研究因变量（目标）和自变量（预测器）之间的关系，通常用于预测分析、时间序列模型以及发现变量之间的因果关系，例如司机的鲁莽驾驶与道路交通事故数量之间的关系。

在2018年有一篇简称为LDDMM（large deformation diffeomorphic metric mapping,大变形微分同胚度量映射）的基于回归分析的深度学习模型论文（请参考 https://arxiv.org/abs/1808.07553），这类摘录作者原文的翻译如下：

“本文提出了一种基于大变形差分对称度量映射（LDDMM）和深度神经网络的纵向缺失图像预测回归模型。我们的模型不是直接预测图像扫描，而是预测与基线图像相关的矢量动量序列。该动量序列在LDDMM框架中参数化原始图像序列，并位于基线图像的切线空间中，该切线空间是欧几里德的。带有长时短记忆（LSTM）单元的递归网络对矢量动量序列的时间变化进行编码，卷积神经网络（CNN）对矢量动量的基线图像进行编码。由LSTM和CNN提取的特征被送入解码网络，重建矢量动量序列，通过LDDMM拍摄使基线图像变形，用于图像序列预测。为了处理某些时间点的缺失图像，我们在损失计算中采用了二值掩码来忽略其重建。实验结果表明，无论纵向图像序列发生大的或细微的变化，这两个数据集中的时空变化都是有希望的预测。”

这种算法在深度学习领域中的泛用性并不高，但是在处理智能车循路的应用中却是比较常用的，因为“基于时空序列的图像来预测时间序列上缺失图像”的算法，蛮适合赛道型这种不需要过高精确度的快速计算。

这个项目的执行脚本在jetbot/notebooks/road_following下面，同样也需要经过“数据收集”、“模型训练”与“现场演示”三个步骤，现在就简单将这三个步骤的重点细节提出来说明一下。

数据采集：data_collection.ipynb 或 data_collection_gamepad.ipynb

这里有两个采集的脚本，前者是使用鼠标来标出坐标、后者则是使用前面使用过的游戏摇杆来选取坐标，二者之间没什么差异，不过推荐用鼠标来进行就可以。

前一个循路应用是基于图像分类的技巧，对“整张图形”进行识别来作为决策的依据，虽然最终能展现找路的功能，但本质上还是“避撞”的相同原理。而这里使用的图像回归算法，则要在图像中找出“下一步前往的目标点”，因此在这里只有“选坐标”的步骤而没有“分类”的过程。

有能力的读者可以访问http://www.youtube.com/embed/FW4En6LejhI的视频，会更清楚这个数据采集的过程。下图是执行data_collection.ipynb采集数据时会显示的互动界面，左边的图像框是与Jetbot的CSI镜头同步的画面，我们的任务就是用鼠标在左边图像中点击“下一步要前往”的目标点，然后右边就会截取这个图像，并用绿色圈标识出我们所点击的位置。

Jetbot系列13-图像回归法实现循路功能

接下来就会在dataset_xy目录里存入一个以”xy_x坐标_y坐标_uuid.jpg”的图像文件，然后在互动界面下方的“count”栏里更新数据集的数量。

Jetbot系列13-图像回归法实现循路功能

下面6组范例截图是在印有“中线”的赛道拼接板上进行采集，这种赛道的采点相对容易，只要点击合适的中线位置就可以。

Jetbot系列13-图像回归法实现循路功能

下面的6组范例截图则是在“没有中线”的赛道采集，例如用跳棋子、定位胶带所形成的赛道，这种就需要自行找到大约的位置就行。

Jetbot系列13-图像回归法实现循路功能

至于采点的“远近”问题，就要看所处的“弯度”而定，如果是在直线赛道的位置可以选择较远的距离，如果在弯度较大的地方就选择近一点的距离，注意路线不要造成Jetbot车轮压倒边线就可以。

每一次用鼠标点击左边图像框时，就会截取一张带有坐标为档名的图像，需要注意的一个细节，如果过程中有不小心点错的图形，最好立即将它删除掉，因为我们很难在事后根据图像去判别哪些图像是有问题的，很难执行数据清洗的作业，而这些不良的图像会影响最终模型的识别效果。

Jetbot系列13-图像回归法实现循路功能

如果是面对较为复杂的赛道（如上图中），最好全程顺时针与逆时针方向都走过一遍，采集足够的图像；如果是规律性较高的赛道（如上图右），就只要采集1/4~1/2的赛道图像也差不多，整个采集量大约在50~100张图片就足够。

模型训练：train_mode.ipynb

这部分也推荐直接在Jetson Nano（含2GB）上进行就可以，经过测试在Jetson Nano 2GB上对100张图片进行70回合训练的时间也就30分钟左右，并不困难，这个脚本同样会挑选精准度最高的存为best_steering_model_xy.pth模型文件，大约42MB左右，比前面两个使用图像分类技术的模型要小很多。

整个训练脚本中，除了前置作业需要解析图像文件名所包含的x, y坐标信息，还有这里所选择使用的神经网络是ResNet18，其余处理重点与先前的避撞项目几乎完全一致，没有什么特殊之处。

现场演示：live_demo.ipynb

先前使用图像分类法的避撞与找路两个项目，都是属于“定速型”的应用，并且会以自身轴心为重点原地旋转。而road_following项目则是让Jetbot义无反顾地往前冲，过程中还可以根据赛道弯度去调节Jetbot的速度(speed)与转角(steering)，这是更加接近我们驾驶车辆的实际状况。

这里使用“比例/微分控制(proportional/derivative control)”算法去动态调节左右电机的转速，这是智能小车领域中相当常用的一种调节行进速度与角度的方法，是个非常成熟的算法，细节请自行在网上查找计算公式，

脚本中一开始导入深度学习模型的操作，与前面的避撞应用是相同的，这里就不重复解说，比较特殊的地方是在脚本中提供三个参数调节滑块，主要如下：

speed gain速度增益滑块：负责控制行进速度，包括要启动JetBot开始跑动，也是透过这个滑块来进行操作。
Steering Gain转向增益滑块：如果JetBot行进是发生摇晃的状态，就透过这个滑块减小这个值，直到Jetbot能顺畅前行为止。
Steering Bias转向偏差滑块：如果JetBot有偏离到轨迹的最右侧或最左侧，就控制此滑块，直到JetBot开始跟随中心的直线或轨迹为止。

下图是live_demo.ipynb执行后，经过调整输出位置的截屏，图左是Jetbot的执行状态，其中x与y值表示当前画面所预测的目标位置，speed表示Jetbot的直线行进速度为全速的百分比，最下面的steering表示转向的速度。

Jetbot系列13-图像回归法实现循路功能

上图中间就是CSI摄像头所看到的当前画面，最右边就是可调节的控制滑块，一开始的时候speed值尽量小一点，避免让Jetbot因为爆冲而损坏，如果沿线运行时的左右摆动幅度太大，可以减小steering的值。

事实上这个应用的最终目的，就是将来可以升级到JetRacer这类的竞速用途智能车（如下图），因为JetRacer所使用的技巧与这个road_following是完全一样的，包括从数据采集、模型训练到现场演示的脚本。

Jetbot系列13-图像回归法实现循路功能

但JetRacer的机电控制更加复杂，整体成本与组装难度也比Jetbot高出许多，因此可以先用这个项目去熟悉竞速车的执行流程与调试细节，未来要升级到JetRacer时就能轻松上手，即便不升级硬件，也能用Jetbot去体验一下竞速车的乐趣。【完】

来源：业界供稿

Jetson Nano

0赞

好文章，需要你的鼓励

Jetbot系列13-图像回归法实现循路功能

来源：业界供稿

2022

02/23

16:24

分享

点赞

人工智能是否存在泡沫风险的深度分析

AI系统在压力下学会战略性欺骗的深层原因

数据中心备份电力系统对比分析

Paxos以超1亿美元收购加密钱包初创公司Fordefi

腾讯发布"读图神器"HunyuanOCR，只用1%的参数就打败了行业巨头？

联想天津工厂入选“世界智能制造十大科技进展” 以零碳智造打造业内标杆

联想万全异构智算研发团队入选IEEE CyberSciTech 2025，RNL技术成果获国际认可！

首款搭载千问的AI硬件：夸克AI眼镜新品发布 次日门店现排队潮

ServiceNow或以超10亿美元收购网络安全初创公司Veza

谷歌云推出"PanyaThAI"计划加速泰国AI应用

英国产学合作推进光纤射频通信技术商业化进程

阿里巴巴推出可换电池设计的Quark AI智能眼镜

Jetson百万开发者故事 | 为了孩子的健康成长，他用NVIDIA Jetson做了一个象棋机器人

Jetson百万开发者故事 | 通过Jetson NANO展现CV实践价值

Jetson开发者破百万，快来说出你的开发故事吧

正当时 NVIDIA Jetson Nano让智能机器人开发易如反掌

Orin开发套件04-安装DeepStream

Jetson Orin开发套件03-安装开发环境

TAO系列12-将模型部署到Jetson设备

TAO系列06-视觉类的数据格式

GTC22 | Jetson开发者日来了 快来点击预约

Jetbot系列13-图像回归法实现循路功能

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

首款搭载千问的AI硬件：夸克AI眼镜新品发布次日门店现排队潮

GTC22 | Jetson开发者日来了快来点击预约