在本系列上一篇文章里,我们为大家介绍了 Jetson Nano 2GB 安装 CSI 摄像头的方法,以及最基础的启动指令。在本篇文章中,我们将向大家展示如何通过 OpenCV 调用 CSI/USB 摄像头。
本期我们会带着大家使用这个摄像头,执行一些很实用的图像处理(image processing)应用,至于计算机视觉(computer vision)的应用,将在下一期里带着大家一起操作。
什么是图像处理?什么又是计算机视觉?如果您有所混淆的话,这里先做个基本说明,二者之间的区隔还是很明显的:
图像处理:输入为图像,输出也是图像
过程中对于图形进行一些应用处理,例如颜色空间(color space)转换、图像格式转换、尺寸转换、角度转换、图像合成等操作,最基本的就是将摄像头的图像读入,显示在屏幕上,并写入磁盘,这就形成一个最简单的录像功能。
计算机视觉:输入为图像,输出为信息
在输入的图像/视频中,找到特定信息的技术,例如基于颜色的追踪、物体边缘的检测、将图像的像素转成信号直方图(histogram)等计算,甚至于车道查找(lane finding)、人脸检测(face detection)等,都属于计算机视觉的范畴,其输入为一张图像,但输出的是某类从图像中淬炼出来的信息。
在 Jetson Nano 2GB 搭建的 JetPack 4.4.1 版本里,内建 OpenCV 4.1.1 版本的开发环境,这是目前图像处理、计算机视觉领域使用率最高的开发工具,因此我们就用 OpenCV 搭配 CSI 摄像头来做图像处理项目。
这里使用 Jetson Nano 2GB 的自带的 gedit 全文编辑器来撰写代码,编程语言使用 Jetson Nano 2GB 预安装的 Python 3.6 版本,由于相关所需的开发环境都已经由 JetPack 4.4.1 完整提供,因此不需要再执行额外的安装,非常简便。
我们可以将视频数据认知为由连续的图像所组合,因此在这里全部以视频处理作为示范,比较动态。至于图像的处理方式,请自行调整代码,二者之间的差异主要在写入磁盘以及是否需要循环指令的部分,如下表:
实现摄像头录像功能
这个功能主要执行三个动作:
从摄像头读入图像
给定文件名
写入磁盘中
这些动作在 OpenCV 都有非常简单的对应指令可以操作,详细代码如下:
本代码以“ESC”键结束录像。
将读入的图像执行缩放
这个功能主要执行三个动作:
摄像头读入图像
调用 cv2.resize 函数进行图像尺寸改变,选择插值方式(cv2.INTER_NEAREST)
在屏幕上显示
完整代码如下:
本代码以“ESC”键结束录像。
将读入的图像执行旋转
这个功能主要执行 4 个动作:
从摄像头读入图像
找出图像中心点
调用 cv2.getRotationMatrix2D() 函数进行旋转
显示:本范例显示 90 度/ 180 度/ 270 度
详细代码如下:
本代码以“ESC”键结束录像。
本文介绍了 3 种在 Jetson Nano 2GB 上,结合 CSI 摄像头与 OpenCV 做的很实用的图像处理应用,应该很容易上手。后面将为您介绍几个常用的计算机视觉应用情况。
好文章,需要你的鼓励
大数据可观测性初创公司Monte Carlo Data推出全新Agent Observability产品,为AI应用提供全方位数据和AI可观测性。该工具帮助团队检测、分类和修复生产环境中AI应用的可靠性问题,防止代价高昂的"幻觉"现象,避免客户信任度下降和系统宕机。新产品采用大语言模型作为评判器的技术,能够同时监控AI数据输入和输出,提供统一的AI可观测性解决方案。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
网络安全公司Aikido披露了迄今最大规模的npm供应链攻击事件。攻击者通过钓鱼邮件获取维护者账户凭证,向18个热门JavaScript包注入恶意代码,这些包每周下载量超过26亿次。恶意代码专门劫持加密货币交易,监控浏览器API接口将资金转移至攻击者地址。受影响的包括chalk、debug等广泛使用的开发工具库。虽然攻击在5分钟内被发现并及时公开,但专家警告此类上游攻击极具破坏性,可能与朝鲜黑客组织相关。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。