在本系列上一篇文章中,我们为大家展示了如何通过 OpenCV 调用 CSI/USB 摄像头,在本篇文章中,我们将向大家介绍如何执行常见机器视觉应用。
在上一篇文章中,已经简单说明了图像处理与计算机视觉的差异,并且在 Jetson Nano 2GB 上,结合 CSI 摄像头与 JetPack 所提供的 OpenCV 4.1.1 版本,实现了三种最基础的应用。每个 Python 代码都只需要 10+ 行就可以,让大家轻松感受到 Jetson Nano 2GB 的开发便利性。
本篇内容主要是在 Jetson Nano 2GB 上运用 OpenCV,执行三个有特色的计算机视觉应用,这部分会很频繁的运用到色彩空间(color space)转换技巧,在 OpenCV 上只需要一道“cv2.cvtColor()”指令就可以实现,非常简单。
接下来就开始本文的实验内容。
追踪特定颜色物件
本范例追踪“绿色”物体,执行步骤如下:
先找出“绿色”的 HSV 颜色范围,本处定在[50,100,100]至[70,255,255]
将读入的图像(frame)透过 cv2.cvtColor() 转成 HSV 格式,存到 hsv 变量
用 cv2.inRange() 函数找出 hsv 的掩码,存到 mask 变量
用 cv2.bitwize_and() 函数将 frame 与 mask 进行 AND 计算,过滤掉“非绿”部分,将结果存到 detect 变量
将原图(frame)、掩码(mask)与结果(detect) 显示在画面上

执行结果如下:

边缘检测(Edge Detection)
执行步骤如下:
这个计算必须将图像转成灰度图像,才能计算出每个物件的边缘线条
将读入的图像(frame)透过 cv2.cvtColor 转成 HSV 灰度图像,存到 hsv 变量
为了降低图形的噪点,因此需要将 HSV 灰度图进行高斯模糊(降噪)处理,直接调用 cv2.GaussianBlur() 函数进行转换,将图像存到 blur 变量中
最后调用 cv2.Canny() 函数为 blur 图像找出边际线条,存入 edges 变量中
为了显示过着中所有图像,因此先将每张图像都调整尺寸为(640,480),然后执行三次 np.concatenate() 函数,将四张图像集成为一张,便于显示。

执行结果如下:

人脸追踪+眼睛追踪
这个代码调用 OpenCV 自带的 HaarCascade 算法分类器,调用方式也很简单,需要指定脸部分类器(classifier)的位置,在 /usr/local/share/opencv4/haarcascades 下面,里面提供将近 20 种分类器,可以按照需求变更。
这个范例也将“眼睛”识别分类器放进去,并且嵌套在脸部识别的循环里面,因为眼睛一定在脸里面,这样可以做的更丰富些。
详细代码如下:

执行结果如下:蓝色框代表找到的“脸”,绿色框表示“眼睛”。

好文章,需要你的鼓励
随着AI在各行业深度应用,传统的"学会编程"建议已不再适用。UCLA等机构的CIO表示,现在更看重候选人的批判性思维、问题解决能力和适应技术变化的敏捷性。新毕业生需要展现AI素养、数据理解能力、云技术expertise和安全意识。编程岗位演变为更具战略性的角色,类似指挥家协调AI工具。入门级职位因自动化而减少,求职者需具备更高技能水平,能够与AI协作而非被其取代。
加州大学伯克利分校研究团队成功让Transformer AI直接从原子三维坐标学习分子结构,无需传统的分子图谱。10亿参数模型在OMol25数据集上的表现可媲美先进图神经网络,且运行更快。AI自发学会了距离-相互作用关系,并能根据分子环境自适应调整关注范围。研究验证了分子AI的规模定律,暗示更大模型将带来更好性能。这项工作为分子建模提供了全新范式,有望推动药物设计和材料科学发展。
9月份LockBit勒索软件新版本的幕后操作者大幅扩大了攻击目标,整体勒索软件攻击激增超过四分之一。NCC集团报告显示攻击量六个月来首次上升28%至421起事件。尽管LockBit曾在Operation Cronos行动中被重创,但其管理员LockBitSupp持续活动。LockBit 5.0新增多平台支持、增强反分析功能、更快加密速度等特性,9月份至少造成十几个受害者,标志着该组织运营恢复。
MediaTek Research团队提出颠覆性"沙漏"MLP架构,将传统"窄-宽-窄"设计反转为"宽-窄-宽",在高维空间进行渐进改进。通过固定随机投影技术,新架构在多项生成任务中显著优于传统设计,用更少参数实现更好性能。研究验证了高维空间增量学习的优越性,为神经网络设计开辟新思路,并展示了向变换器等架构扩展的潜力。