TAO系列11-物件检测的模型训练与优化-3

当前面已经训练好修剪过的模型之后，接下来就可以在训练设备上先执行推理计算，看看检测的效果如何？如果实际推理结果并不理想的话，就得回到前面第6步骤重新再执行一次。

【接上文】当前面已经训练好修剪过的模型之后，接下来就可以在训练设备上先执行推理计算，看看检测的效果如何？如果实际推理结果并不理想的话，就得回到前面第6步骤重新再执行一次。

执行推理并查看结果

这边首先创建一个 test_samples 目录，然后从数据集中testing/image_2中复制一些图像过来测试，推理结果输出到ssd_infer_images目录下，这个推理计算也可以使用未修剪的模型来进行测试。

在代码框 ”!tao ssd inference” 后面所提供的参数中，下面两行是使用修剪后并重新训练的模型来进行推理。

-e $SPECS_DIR/ssd_retrain_resnet18_kitti.txt \

-m $USER_EXPERIMENT_DIR/experiment_dir_retrain/weights/ssd_resnet18_epoch_$EPOCH.tlt \

如果将这两行参数改成下面内容，就是用原始模型来进行推理。

-e $SPECS_DIR/ssd_train_resnet18_kitti.txt \

-m $USER_EXPERIMENT_DIR/experiment_dir_unpruned/weights/ssd_resnet18_epoch_$EPOCH.tlt \

这样我们可以执行透过推理结果，来查看二者的不同。下面两张图分别是未修剪（上）与修剪后（下）模型推理结果的局部放大，虽然修剪后的模型效果不如未修剪的，但是执行结果还是令人满意，当然这得看您的要求有多高。

TAO系列11-物件检测的模型训练与优化-3

如果认可这个推理结果的话，那么训练阶段的任务就可以告一段落，接下去就准备将模型导出，以便部署到真是的推理设备上。

导出模型

要执行这个步骤，最好先确认您的推理设备上所能支持的数据精度，特别是INT8类型，例如Jetson Nano（含2GB）、TX2/TX1就不支持，Xavier NX与AGX Xavier是支持的。台式机上的游戏卡一般不支持INT8，而Tesla、Quadro专业卡是支持的，不过NVIDIA全系列产品都支持FP16，如果不能确认这方面的信息，至少选择FP16是比较稳妥。

简单说明一下代码框 “!tao ssd export” 后面的参数：

-m	选择要导出的模型，可以是未修剪的或者修剪过的 .tlt 文件
-o	输出的模型文件名，以 .etlt 为附加档名
-e	使用的配置文件，导出未修剪的.tlt文件，则配置文件使用xxx_train_xxx.txt，导出修剪过的.tlt模型，则配置文件使用xxx_retrain_xxx.txt
--data_type	指定导出模型可用的最低数据精度，例如 fp32、fp16、int8
--gen_ds_config	这个参数是针对DeepStream视频分析软件，如果给定的话，就是同时生成“nvinfer_config.txt”这个DeepStream会用到的配置文件

假如要输出INT8模型时，由于需要特殊算法以及辅助的校准工具，因此需要其他参数来协助这类模型的导出，主要如下：

--cal_image_dir	作为校准用途的图像数据目录
--batches	每次校准所用的图像数量
--cal_cache_file	存放校准过程文件的路径
--cal_data_file	存放校准最终的张量文件

这样就能完成INT8模型的输出任务。

到这里所输出的.etlt模型文件基本上已经可以部署到DeepStream推理设备上使用，因为DeepStream支持.etlt格式的调用，相当方便。但如果要用其他独立的TensorRT来执行加速推理的话，就需要在推理设备上再进行一次的转换。

本步骤最后一个代码块 ”!tao converter” 就是在训练设备上，将 .etlt 模型转成这台机器能使用的TensorRT引擎文件。由于参数内容较多，这里不一一列举，请自行至https://docs.nvidia.com/tao/tao-toolkit/text/object_detection/ssd.html搜索“Using the tao-converter”环节，有详细的参数说明。

要注意的一点，在 ”!tao converter” 所使用的 ”-t” 指定数据精度部分，需要与前面 “!tao ssd export” 的 “--data_type” 一致，否则会失去效果。

验证部署模型的效果

这个步骤是验证TensorRT加速引擎的推理效果，主要让我们在部署到推理设备之前，能再确认一下推理效果。

下面同样提供两张推理结果参照图，上图是未修剪的模型转成TensorRT引擎的推理结果，下图是修剪过的模型转成TensorRT引擎的推理结果，效果看起来是一样的，表示这个修剪过的模型还是足够好的。

TAO系列11-物件检测的模型训练与优化-3

现在就完成一个物件检测模型训练的过程，虽然看起来繁琐，但是只要我们弄清楚一开始的路径对应，以及熟练后面每个环节的参数用法，基本上要比在框架中自行撰写代码容易得多了，除了收集与整理数据的工作是TAO工具无法协助的，其余部分已经都为大家提供好完整的指令块，这是一个真正“Zero Coding”的全方位模型训练工具。【完】

来源：业界供稿

NVIDIA Jetson

0赞

好文章，需要你的鼓励

TAO系列11-物件检测的模型训练与优化-3

来源：业界供稿

2022

05/17

14:36

分享

点赞

从传统CRM迈向智能化客户互动的转型之路

Wonder与Zipline合作，无人机送餐服务将于2027年在德克萨斯州上线

无人机卫星通信突破：轻量化终端助力野火响应

Google承认AI发展速度已超过电网脱碳速度

欧盟拟将AWS和Azure列为数字市场"守门人"

隆湫资本完成对「蓝芯算力」Pre-B轮超3亿元独家投资

Visa、Stripe等140余家机构联合推出Open USD稳定币，剑指Tether

Anthropic发布Claude Sonnet 5大语言模型，编程能力与安全性双升级

Wayve以85亿美元估值启动8500万美元员工股权流动计划

遗留系统与数据缺口制约香港企业财资中心发展

美国要求OpenAI限制其最强大AI模型的访问权限

两党州长达成共识：数据中心建设费用不应转嫁给普通用户

分析：NVIDIA第二季度财报再次超出预期背后的新问题

Jetson百万开发者故事 | 校企合作推动实现多项工业场景下AI边缘计算应用

Jetson百万开发者故事 | NVIDIA Jetson助力水产养殖企业打造自动化流水线

Jetson百万开发者故事 | 基于Jetson Nano的便携式岩石分类检测系统：地质学家的新利器

Jetson百万开发者故事 | 让AI成为铁路客运站自动扶梯安全管控的关键

Jetson百万开发者故事 | Jetson开发者突破百万，从TK1到Orin我都经历了啥

百万Jetson开发者故事

Jetson百万开发者故事 | NVIDIA Jetson如何成为可移动智能脑机交互平台

全新NVIDIA Jetson Orin NX 16GB大幅提升边缘AI性能

Triton推理服务器13-模型与调度器(3)

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: