Jetson NANO 2GB系列文章（18）：Utils的videoSource工具

如果你认为这两个功能只是简单地负责数据接收与显示的话，这就大大浪费了项目作者的心血结晶，因此我们在进入本项目另外两个深度学习推理应用之前，先要把这两个幕后功臣的内涵展现出来，因为这与后面的应用息息相关。

前两篇已经用10行Python代码展现了Hello AI World强大而且简便的物件检测识别能力，虽然大部分的人都将目光集中在了深度学习的三大推理识别（图像分类、物件检测、语义分割），但是在整个项目中，其实还有两个非常重要的功臣功能，那就是videoSource()与videoOutput()这两个专司输入与输出的接口。

本文先就videoSource()这个功能进行说明。

有经验的开发人员都清楚，输入源的种类十分多样，并且格式非常繁琐，其中还包括图像的颜色空间（color space）变化，要全部集成在一个函数中去调用，已经是非常高难度的事情了，如果这个函数还能为我们集成Jetson的编解码芯片的调用，以及将许多非常图像处理的计算交由CUDA核去计算，这就是一个值得我们为之欢呼的功能了。

videoSource()功能是项目作者一个集大成的作品，具备以下特点：

支持7种输入源方式：

CSI摄像头：”csi://0”
USB摄像头：”/dev/video<N>”，其中<N>置换成指定的USB摄像头编号
RTP视频流：”rtp://<remote_ip>:1234”
RTSP视频流：”rtsp://username:password@<remote-host>:1234”
视频文件：”完整文件名”，例如 ”input.mp4”
图像文件：”完整文件名”，例如 “room_0.jpg”
文件夹：如果识别”完整文件名”是个文件夹时，就会把目录下文件整批作为输入

支持7种视频格式：H.264、 H.265、VP8、 VP9、 MPEG-2、MPEG-4以及MJPEG
支持9种图像格式：JPG、 PNG、TGA、BMP、GIF、PSD、 HDR、 PIC以及PNMs
自动根据数据源，调用合适的NVDEC解码功能
将数据计算紧密结合CUDA计算核

这样一列出来，是否已经感受到了这一功能的强大呢？由于集成这么多特点，可以使代码的调用变得异常简单，而且完全发挥Jetson Nano 2GB的硬件计算资源，兼具“易用”与“高效”两个极端的特色。接下来我们就用几个简单的代码，带着大家体验一下这个工具的用法。

现在请大家先回忆一下用openCV建立CSI摄像头对象的代码，如下：

cameraCsi = cv2.VideoCapture(

"nvarguscamerasrc sensor-id=0 ! "

"video/x-raw(memory:NVMM), width=(int)1280, height=(int)720, "

"format=(string)NV12, framerate=(fraction)60/1 ! "

"nvvidconv flip-method=0 ! "

"video/x-raw, width=(int)1280, height=(int)720, format=(string)BGRx ! "

"videoconvert ! video/x-raw, format=(string)BGR ! appsink" )

这种调用是非常艰涩而且容易出错的，对大部分初学者来说的确比较痛苦，导致很多人一开始都不愿意使用性能较好、功耗较低的CSI摄像头。但是在videoSource()这里，只需要简单填入 ”csi://0” 就能创建。

在前面“10lines.py”代码中，已经提供了CSI摄像头、USB摄像头，以及视频文件的调用方式，事实上类似的方法也适用于RTP/RTSP视频流以及图像文件作为输入源。

然而这里面增加一个对“文件夹”的支持，更是一个非常实用的功能，不过在“图像分类”、”物件识别“与“语义分割”的应用中，都有很大部分的使用场景是针对“众多独立图像”的推理，如果每次都只能一张一张的读入然后识别，就会显得十分没效率。

下面将“10lines.py”做简单的修改，以jetson-inferencet提供的图像文件为例，让大家体验一下这个功能的好处：

import jetson.utils

input = jetson.utils.videoSource("source")

output = jetson.utils.videoOutput("detection")

import jetson.inference

net = jetson.inference.detectNet("ssd-mobilenet-v2", threshold=0.5)

while output.IsStreaming():

img = input.Capture()

detections = net.Detect(img)

output.Render(img)

上面代码中，将输入源与输出标的设为两个不同的目录，执行之前先将这个代码复制到~/jetson-inference/data/images/去，并且为source目录添加一些图片。完整的执行指令如下：

cp 10lines.py ~/jetson-inference/data/images
cd ~/jetson-inference/data/images
mkdir source detection
cp object* source
python3 10lines.py

这样就会开始从source目录读入图像文件，执行物件识别推理后，将结果输出到detection目录中（如下图）。

Jetson NANO 2GB系列文章（18）：Utils的videoSource工具

这里之所以不选择输出到显示器，是因为显示的过程太快，没法在显示器上暂留，所以输出到另一个目录存成图片，会是比较合适的方法。

执行完成后，进入detection目录中，可以浏览到如下图的输出结果。

Jetson NANO 2GB系列文章（18）：Utils的videoSource工具

最后还有一个重点，就是调用NVDEC硬解码器的时机，前面提到videoSourec()会自动根据输入源的类型，去调用合适的解码器，不过这部分细节在作者的使用文档中并没有讲解，只能靠不断地尝试。

要检查解码器的启动与否，我们可以使用一开始教大家的jetson-stats检测工具，打开之后关注左下角“NVDEC”的变化，大部分时候都是处于[OFF]，但当我们的输入源是视频文件、RTP/RTSP这三种类型时，“NVDEC”后面会出现主频的变化（如下图），表示这时候已经被启动。

Jetson NANO 2GB系列文章（18）：Utils的videoSource工具

本文有条理地将videoSource()的重要特色进行了说明，就是为了后面执行其他推理识别应用时会使用到，也希望能让读者学会更多的用法。

来源：业界供稿

Jetson Nano

0赞

好文章，需要你的鼓励

Jetson NANO 2GB系列文章（18）：Utils的videoSource工具

来源：业界供稿

2021

06/01

09:43

分享

点赞

REDMI Note 15 Pro+发布，同档最抗摔的实战之王，首销 1899元起

数学AI也会"装懂"？四川大学研究团队揭示AI缺失的核心能力

挪威人形机器人公司1X CEO：我们的产品先进家庭，而非工厂，硅谷的硬件迭代比深圳差很远，大家对遥操作有误解，靠世界模型拿到投资

戴尔科技：智能数据平台弥合数据鸿沟 三位一体数据保护体系护航企业安全

那些年的国民零食，为什么突然在拼多多火了？

AI再走一步，会发生什么？答案在“预见2026”

CCF HPC China 2025鄂尔多斯完美谢幕，共谱超算新篇章

生成式引擎优化GEO：在线零售商的新营销手册

数据中心电池储能系统如何抵御新兴网络威胁

英特尔如何解决数据中心液冷技术的“接头难题”？

Google发布Pixel 10系列及新AI智能助手功能

Google推出Gemini for Home智能家居新战略

Jetson百万开发者故事 | 为了孩子的健康成长，他用NVIDIA Jetson做了一个象棋机器人

Jetson百万开发者故事 | 通过Jetson NANO展现CV实践价值

Jetson开发者破百万，快来说出你的开发故事吧

正当时 NVIDIA Jetson Nano让智能机器人开发易如反掌

Orin开发套件04-安装DeepStream

Jetson Orin开发套件03-安装开发环境

TAO系列12-将模型部署到Jetson设备

TAO系列06-视觉类的数据格式

GTC22 | Jetson开发者日来了 快来点击预约

Jetbot系列13-图像回归法实现循路功能

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

戴尔科技：智能数据平台弥合数据鸿沟三位一体数据保护体系护航企业安全

GTC22 | Jetson开发者日来了快来点击预约