TAO系列07-视觉数的数据增强

但是能够呈现我们所要特征的数据量通常是很有限的，所以显得特别珍贵。虽然我们可以在这些图形上进行非常精密的标注，但碍于数量的限制，在最终训练出来的模型效果还是会大打折扣。

“优质数据”是训练出好模型的前提，如同食材对于料理的重要性，是一样的道理。通用类数据集能应付大部分实验用途的需求，但面对很多特定场景时就不是那么管用了，例如在工业上的PCB板瑕疵检测、物流分拣功能、农业蔬果采摘、医学肿瘤分享等应用，就需要在实际场景中采集现场数据。

数据增强(augment)技术能非常有效地解决数据量不足的问题，透过多种图像处理的技巧，例如空间转换、颜色调整、模糊度等方式，将这些珍贵而且有限的图像数据进行极大化的扩充，白话地说就是把一张图像当10张用，如果我们手上只有100张优质图像，就能扩充到上千张，然后合并到训练用途的数据集中，这样就能解决数据量不足的问题。

TAO启动器提供的augment指令，就是负责处理离线图像增强的功能，目前具备以下三类图像处理的方式：

空间增强：包括旋转(Rotate)、翻转(Flip)、平移(Translate)、错切(Shear)等处理；
颜色增强：包括色调旋转与饱和度(Hue Rotation and Saturation)、亮度偏移(Brightness offset)与对比度偏移(Contrast shift)等处理；
图像模糊：使用高斯模糊(blur)增强

下图是一个简单的例子，将左边原始数据透过不同图像处理技巧，就能获得更多的变种图像（中间与右边），然后将增强过的图像与标注，纳入训练用的数据集中。

TAO系列07-视觉数的数据增强

图像增强过程中比较复杂的部分，只要牵涉到“空间增强”的处理，例如将图像做90度旋转处理或改变图像尺寸等，就得将标注文件中所有对象的标框坐标也跟着做转换，存放到新图像所对应的标注文件中，这是增强过程中最关键的处理。

执行这项任务还需要一个配置文件的辅助，将要处理的效果写入配置文件中，然后使用 ”tao augment -a <配置文件> -d <原始数据路径> -o <输出路径>” 指令格式，就能执行数据增强的任务。

配置文件里面主要分为以下四个组别：

空间增强配置：以 “spatial_config{...}” 进行隔离，包含以下功能与配置

rotation_config{...}：配置旋转的角度以及单位（角度或弧度）
flip_config{...}：配置垂直翻转与水平翻转的开关
translation_config{...}：配置x轴与/或y轴的平移数量，以像素为单位
shear_config{...}：配置x轴与/或y轴的错切比例

颜色增强配置：以 “color_config{...}” 进行隔离，包含以下功能与配置内容

hue_saturation_config{...}：配置色调旋转角度与饱和度位移的数量
contrast_config{...}：配置对比度的缩放量与中心点
brightness_config{...}：配置亮度的x轴与/或y轴平移量，以像素为单位

模糊增强配置：以 “blur_config{...}” 进行隔离，配置要卷积的内核的大(size)与高斯滤波器的模糊标准差(std)的值
图像尺度与格式配置：包括以下

output_image_width: 输出图像宽度，以像素为单位
output_image_height: 输出图像高度，以图像为单位
output_image_channel: 输出的图像通道数，可选1或3
image_extension: 输出图像格式，有".png"、".jpeg"、".jpg"可选项

关于各项参数的详细配置细节，请访问https://docs.nvidia.com/tao/tao-toolkit 里面CV Applications下的 “Offline Data Augmentation” 部分。

现在就开始执行TAO提供的augment范例，请在Jupyter进入cv_samples/augment目录中，里面有augment.ipynb脚本以及specs目录中有一个default_spec.txt配置文件。

点击augment.ipynb开启执行脚本，按照以下步骤执行：

配置环境变量：

脚本中“0_Set up env variables”步骤中，第一个执行块就是配置环境变量。最简单的配置就是将“LOCAL_PROJECT_DIR”设为目前执行位置。请执行以下修改：

将 os.environ["LOCAL_PROJECT_DIR"] = FIXME

改成 os.environ["LOCAL_PROJECT_DIR"] = os.getcwd()

然后执行这个步骤的三个指令块。

安装TAO启动器：这个安装步骤在前面已经执行过，因此这里直接跳过去。
准备数据集：

因为augment功能只支持KITTI格式，因此必须准备这种格式的数据集，如果使用其他格式数据集，请先坐好格式转换。

执行脚本在这里指引大家去KITTI官方网站下载数据集，但整个过程相当繁琐，而且从境外下载的网速也个问题，因此请跳过整个 “A. Download the dataset” 所有执行块，以及 “B. Verify downloaded dataset” 前三个执行块。

我们在https://pan.baidu.com/s/1WcRt9ONqsYhLRmL8Rg8_YQ（密码855n）百度网盘上存放了data_object_image_2.zip与data_object_label_2.zip两个压缩文件，直接在这里下载到augment目录下比较方便。

下载完后，请在Jupyter开启一个终端，执行以下指令：

cd ~/tao/cv_samples/augment # 请根据您实际路径

unzip -u data_object_image_2.zip -d data

unzip -u data_object_label_2.zip -d data

然后就会形成以下的目录结构：

TAO系列07-视觉数的数据增强

现在执行 “B. Verify downloaded dataset” 的最后两个指令块 “# verify” 与 “ Sample Kitti label”，能如下图般正常执行就表示数据环境都已经调试完成。

TAO系列07-视觉数的数据增强

执行数据增强的工作：

在执行以下指令块之前，先打开specs/dafault_spec.txt文件，里面的设置组在前面已经讲解过，请自行添加或删除设置组的参数，存档后执行下面指令块：

TAO系列07-视觉数的数据增强

正确执行时，会在最下面出现下图的信息，表示正在根据配置文件的参数，进行数据增强的作业。

TAO系列07-视觉数的数据增强

可以比对一下原始数据的标签与增强后的同名标签，看看里面的不同之处，并且试着多修改配置文件里面的各项参数，比对一下不同参数所产生的效果。

增强结果的可视化：这个步骤主要是在Jupyter上查看增强后的图片，请自行处理。

由于增强后的数据集文件名与原始数据相同，因此最后还需要再做一个“批量改名”的工作，在Ubuntu操作系统可以用以下指令来执行：

sudo apt install rename

# 在文件名开头添加字符，例如‘a’。注意，图像与标签的文件名必须对应上

cd <增强后的图像路径> && rename 's/^/a/' *.png

cd <增强后的标签路径> && rename 's/^/a/' *.txt

然后将修改过文件名的图像与标签文件，全部移到原始数据集中，这样就能让数据集的内容快速扩充，即便原本的优质数据量只有100张的数量，也可以轻松透过这个TAO的数据增强工具，迅速扩充到好几倍的数据量，提高模型训练的结果。【完】

来源：业界供稿

NVIDIA Jetson

0赞

好文章，需要你的鼓励

TAO系列07-视觉数的数据增强

来源：业界供稿

2022

04/20

16:53

分享

点赞

据说算力高达1000 TOPS，华硕Ascent GX10深度评测——模型推理

上交联手阿里团队打造"AI记忆管家"ReMe，像人类一样从经验中学习

意大利航空携手ESA部署卫星通信技术提升飞行效率

苹果TV急需PoE支持以释放企业应用潜力

Google Translate为所有耳机带来实时语音翻译功能

生成式AI在心理健康咨询中的时间规律与人类使用习惯分析

回顾我们的2025年AI预测：准确性如何？

ServiceNow斥资10亿美元收购Veza 加速智能体权限管理

除英伟达和台积电外，其他AI公司都需要靠量补利

2025年数据中心芯片领域最热门发展趋势

自动化技术领导者揭示企业对AI认知的关键误区

五分之三企业对Wi-Fi投资信心增强

分析：NVIDIA第二季度财报再次超出预期背后的新问题

Jetson百万开发者故事 | 校企合作推动实现多项工业场景下AI边缘计算应用

Jetson百万开发者故事 | NVIDIA Jetson助力水产养殖企业打造自动化流水线

Jetson百万开发者故事 | 基于Jetson Nano的便携式岩石分类检测系统：地质学家的新利器

Jetson百万开发者故事 | 让AI成为铁路客运站自动扶梯安全管控的关键

Jetson百万开发者故事 | Jetson开发者突破百万，从TK1到Orin我都经历了啥

百万Jetson开发者故事

Jetson百万开发者故事 | NVIDIA Jetson如何成为可移动智能脑机交互平台

全新NVIDIA Jetson Orin NX 16GB大幅提升边缘AI性能

Triton推理服务器13-模型与调度器(3)

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: