在本系列上一篇文章里,我们带领大家体验了视觉功能库。在本篇文章中,我们将带领大家安装与调用摄像头。
不管是 AI 深度学习或者 IOT 应用中,视觉处理都占据非常大的使用比例,而摄像头更是使用率最高的数据源设备,本文就带领大家为 Jetson Nano 2GB 安装摄像头,并且通过一些工具与简单代码,对摄像头进行测试。
Jetson Nano 2GB 开发者套件支持 CSI 摄像头、USB 摄像头和网络摄像头。
本文主要针对入门者,所以重点放在 CSI 摄像头与 USB 摄像头这两种比较合适的设备上,至于 GigE 这种复杂度较高的摄像头,先不做说明。
如何为 Jetson Nano 2GB
选择 CSI 或者 USB 摄像头
在选择摄像头之前,我们可以通过以下网址查看:
这里列出了 NVIDIA 官方推荐的摄像头型号。
一般来说 USB 接口摄像头都是免驱支持,不多做说明。
但是 CSI 接口的摄像头根据传感器芯片的不同区别很大,不是任何一款 CSI 摄像头都支持 Jetson Nano 产品,所以购买时一定要注意这个问题。目前在 Jetson Nano 上,开发者们常用的 CSI 摄像头是树莓派 V2 摄像头(传感器芯片是 IMX219)。
文章中,我们使用的就是以下这款:
【注意】CSI 摄像头不支持即插即用,所以必须在开机前先装上去,系统才能识别 CSI 摄像头,如果开机之后再安装,会导致 Jetson Nano 2GB 识别不出摄像头,且有其他风险,因此请避免在开机状态下安装摄像头。
安装 CSI 摄像头
Jetson Nano 2GB 有一个 CSI 摄像头接口,位置与外观如下图。
安装摄像头排线之前,我们首先要拔起上面的插销,请一定要特别小心,千万别弄断这个小塑料片,是会影响质保的。
有金手指(金属针头)的部分,必须面向 CSI 接口与摄像头接口有排针的一面,并且谨慎地让排线插到底,否则会有接触不良的问题。最后轻轻扣上插销,安装完成!
检测摄像头
安装好摄像头后,我们需要检测一下是否安装正确。
我们为了演示,安装了 1 个 CSI 摄像头以及 2 个 USB 摄像头:
最简单的检测指令如下:
如果摄像头没有问题,且安装正确,这个指令会显示目前安装的摄像头数量。如下截屏:
你会看到列出了单个设备,但是这样的信息量太少,通常无法判断到底哪个编号是哪个摄像头。
要更进一步检测摄像头数量与详细规格,就需要 v4l2-utils 这个工具协助,安装方法很简单,如下指令:
安装完之后,可以用以下指令检测比较完整的信息:
本例中执行这个命令后,会看到下面截屏信息,将三个摄像头都列清楚:
这里就能非常清楚看到第一个(/dev/video0)属于 imx219 规格(CSI)摄像头,第二个(dev/video2)是 USB2.0 的摄像头,接到 xusb-2(规格是 USB3)接口,第三个(/dev/video1)是 USB 摄像头,接到 xusb-3.2 (规格是 USB2)接口,这样就能一目了然知道哪个编号对应哪个摄像头。
接下来还可以用这个指令,进一步检测每个摄像头的更细致规格,包括所支持的图像种类、宽高、帧数等等,这些在后面使用代码时很重要。
请执行以下指令,来看一下第一个 CSI 摄像头的规格参数:
这里更精确地列出了这个摄像头的细节参数,例如显示的“RG10”就算代表这个摄像头的数据格式,下面的“10-bit Bayer RGRG/GBGB”则是进一步说明这个格式使用的算法与通道对应的参数。
再下面的尺寸,例如 3264x2464,其下还有对应的 Interval 性能参数,表示所支持的分辨率,以及该分辨率的最高执行帧率,这样的信息量才能够帮助我们在后面开发应用时作为设定的依据。
其他的设备,请自行修改。
下一篇文章里,我们将教大家如何调用摄像头,敬请关注吧!
好文章,需要你的鼓励
一旦人工智能达到通用智能(AGI)或超级智能(ASI)水平,人类将无法逆转回传统AI。AGI与人类智力相当,ASI则超越人类智慧。由于人类会对此类AI产生依赖,且AGI/ASI具备自我保护能力,通过全球禁令、内置终止开关或控制措施都难以有效阻止。AI末日论者担心existential风险,而AI加速主义者认为将解决人类问题。唯一可能的逆转机会是AGI/ASI主动选择关闭自己以拯救人类。
新加坡国立大学研究团队开发了SPIRAL框架,通过让AI与自己对弈零和游戏来提升推理能力。实验显示,仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%,通用推理提升8.4%,且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中,为AI训练提供了新思路。
开源加密初创公司ZamaSAS宣布完成5700万美元B轮融资,专注于为区块链和AI应用构建全同态加密技术以保护隐私。本轮融资由BlockchangeVentures和PanteraCapital共同领投,使公司总融资超过1.5亿美元,估值突破10亿美元。同时,Zama推出保密区块链协议公开测试网,允许开发者在以太坊上构建私密通信应用。
同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息,创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系,结合深度学习和数学优化方法,在合成数据集上实现37.9%的精度提升,并在真实设备上展现出色泛化能力,为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。