TAO系列11-物件检测的模型训练与优化-3

当前面已经训练好修剪过的模型之后，接下来就可以在训练设备上先执行推理计算，看看检测的效果如何？如果实际推理结果并不理想的话，就得回到前面第6步骤重新再执行一次。

【接上文】当前面已经训练好修剪过的模型之后，接下来就可以在训练设备上先执行推理计算，看看检测的效果如何？如果实际推理结果并不理想的话，就得回到前面第6步骤重新再执行一次。

执行推理并查看结果

这边首先创建一个 test_samples 目录，然后从数据集中testing/image_2中复制一些图像过来测试，推理结果输出到ssd_infer_images目录下，这个推理计算也可以使用未修剪的模型来进行测试。

在代码框 ”!tao ssd inference” 后面所提供的参数中，下面两行是使用修剪后并重新训练的模型来进行推理。

-e $SPECS_DIR/ssd_retrain_resnet18_kitti.txt \

-m $USER_EXPERIMENT_DIR/experiment_dir_retrain/weights/ssd_resnet18_epoch_$EPOCH.tlt \

如果将这两行参数改成下面内容，就是用原始模型来进行推理。

-e $SPECS_DIR/ssd_train_resnet18_kitti.txt \

-m $USER_EXPERIMENT_DIR/experiment_dir_unpruned/weights/ssd_resnet18_epoch_$EPOCH.tlt \

这样我们可以执行透过推理结果，来查看二者的不同。下面两张图分别是未修剪（上）与修剪后（下）模型推理结果的局部放大，虽然修剪后的模型效果不如未修剪的，但是执行结果还是令人满意，当然这得看您的要求有多高。

TAO系列11-物件检测的模型训练与优化-3

如果认可这个推理结果的话，那么训练阶段的任务就可以告一段落，接下去就准备将模型导出，以便部署到真是的推理设备上。

导出模型

要执行这个步骤，最好先确认您的推理设备上所能支持的数据精度，特别是INT8类型，例如Jetson Nano（含2GB）、TX2/TX1就不支持，Xavier NX与AGX Xavier是支持的。台式机上的游戏卡一般不支持INT8，而Tesla、Quadro专业卡是支持的，不过NVIDIA全系列产品都支持FP16，如果不能确认这方面的信息，至少选择FP16是比较稳妥。

简单说明一下代码框 “!tao ssd export” 后面的参数：

-m	选择要导出的模型，可以是未修剪的或者修剪过的 .tlt 文件
-o	输出的模型文件名，以 .etlt 为附加档名
-e	使用的配置文件，导出未修剪的.tlt文件，则配置文件使用xxx_train_xxx.txt，导出修剪过的.tlt模型，则配置文件使用xxx_retrain_xxx.txt
--data_type	指定导出模型可用的最低数据精度，例如 fp32、fp16、int8
--gen_ds_config	这个参数是针对DeepStream视频分析软件，如果给定的话，就是同时生成“nvinfer_config.txt”这个DeepStream会用到的配置文件

假如要输出INT8模型时，由于需要特殊算法以及辅助的校准工具，因此需要其他参数来协助这类模型的导出，主要如下：

--cal_image_dir	作为校准用途的图像数据目录
--batches	每次校准所用的图像数量
--cal_cache_file	存放校准过程文件的路径
--cal_data_file	存放校准最终的张量文件

这样就能完成INT8模型的输出任务。

到这里所输出的.etlt模型文件基本上已经可以部署到DeepStream推理设备上使用，因为DeepStream支持.etlt格式的调用，相当方便。但如果要用其他独立的TensorRT来执行加速推理的话，就需要在推理设备上再进行一次的转换。

本步骤最后一个代码块 ”!tao converter” 就是在训练设备上，将 .etlt 模型转成这台机器能使用的TensorRT引擎文件。由于参数内容较多，这里不一一列举，请自行至https://docs.nvidia.com/tao/tao-toolkit/text/object_detection/ssd.html搜索“Using the tao-converter”环节，有详细的参数说明。

要注意的一点，在 ”!tao converter” 所使用的 ”-t” 指定数据精度部分，需要与前面 “!tao ssd export” 的 “--data_type” 一致，否则会失去效果。

验证部署模型的效果

这个步骤是验证TensorRT加速引擎的推理效果，主要让我们在部署到推理设备之前，能再确认一下推理效果。

下面同样提供两张推理结果参照图，上图是未修剪的模型转成TensorRT引擎的推理结果，下图是修剪过的模型转成TensorRT引擎的推理结果，效果看起来是一样的，表示这个修剪过的模型还是足够好的。

TAO系列11-物件检测的模型训练与优化-3

现在就完成一个物件检测模型训练的过程，虽然看起来繁琐，但是只要我们弄清楚一开始的路径对应，以及熟练后面每个环节的参数用法，基本上要比在框架中自行撰写代码容易得多了，除了收集与整理数据的工作是TAO工具无法协助的，其余部分已经都为大家提供好完整的指令块，这是一个真正“Zero Coding”的全方位模型训练工具。【完】

来源：业界供稿

NVIDIA Jetson

0赞

好文章，需要你的鼓励

TAO系列11-物件检测的模型训练与优化-3

来源：业界供稿

2022

05/17

14:36

分享

点赞

REDMI Note 15 Pro+发布，同档最抗摔的实战之王，首销 1899元起

数学AI也会"装懂"？四川大学研究团队揭示AI缺失的核心能力

挪威人形机器人公司1X CEO：我们的产品先进家庭，而非工厂，硅谷的硬件迭代比深圳差很远，大家对遥操作有误解，靠世界模型拿到投资

戴尔科技：智能数据平台弥合数据鸿沟 三位一体数据保护体系护航企业安全

那些年的国民零食，为什么突然在拼多多火了？

AI再走一步，会发生什么？答案在“预见2026”

CCF HPC China 2025鄂尔多斯完美谢幕，共谱超算新篇章

生成式引擎优化GEO：在线零售商的新营销手册

数据中心电池储能系统如何抵御新兴网络威胁

英特尔如何解决数据中心液冷技术的“接头难题”？

Google发布Pixel 10系列及新AI智能助手功能

Google推出Gemini for Home智能家居新战略

分析：NVIDIA第二季度财报再次超出预期背后的新问题

Jetson百万开发者故事 | 校企合作推动实现多项工业场景下AI边缘计算应用

Jetson百万开发者故事 | NVIDIA Jetson助力水产养殖企业打造自动化流水线

Jetson百万开发者故事 | 基于Jetson Nano的便携式岩石分类检测系统：地质学家的新利器

Jetson百万开发者故事 | 让AI成为铁路客运站自动扶梯安全管控的关键

Jetson百万开发者故事 | Jetson开发者突破百万，从TK1到Orin我都经历了啥

百万Jetson开发者故事

Jetson百万开发者故事 | NVIDIA Jetson如何成为可移动智能脑机交互平台

全新NVIDIA Jetson Orin NX 16GB大幅提升边缘AI性能

Triton推理服务器13-模型与调度器(3)

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

戴尔科技：智能数据平台弥合数据鸿沟三位一体数据保护体系护航企业安全