/

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

本系列最后一个需要说明的推理识别应用，就是语义分割（semantic segmentation）的推理识别，字面上经常造成初学者的误解，以为这是语音语义识别相关的应用。现在我们看看下面的一张图片，就比较能理解语义分割的应用是什么。

本系列最后一个需要说明的推理识别应用，就是语义分割（semantic segmentation）的推理识别，字面上经常造成初学者的误解，以为这是语音语义识别相关的应用。现在我们看看下面的一张图片，就比较能理解语义分割的应用是什么。

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

在这张图中，可以看到每种“类别”是用“颜色”做区隔，并且每个物件已不再是“矩形框”的标注方式，而是完全将物件的原本形状都标示出来，如此就能更进一步地用计算机视觉的方式，将“全场景”与“物件”之间，形成信息量更完整的“语义”表述。

这类的应用场景，大部分都是“专业”用途，例如医学成像、肿瘤分析、航拍识别、无人驾驶、城市规划之类，对“精确度”要求更高的应用，属于“像素级”的推理识别，其难度与计算量，比前面的图像分类、物件检测要高出许多，对初学者来说，只要简单体验一下就可以。

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

Hello AI World项目为语义分割应用，也同样提供segnet指令与segnet.py代码，二者的使用方式与功能是相同的，指令的主要参数列表条列如下，其中黄色标出的部分是比较重要的参数：

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

--network参数应该是很熟悉了，项目也为这个应用提供11个预训练模型可轻松调用（如下表）：

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

系统预设的网络模型是FCN-ResNet18-Pascal-VOC-320x320（Pascal VOC 320x320），这是个比较通用类的模型。

前面提过，语义分割的推理识别，最终以“颜色”来进行分类的显示，而每种模型的分类与对应颜色都不一样，所以必须有这样的对照表去比对。在~/jetson-inference/data/networks下面有多个“FCN-”带头的子目录，下面放的都是segnet使用的预训练模型文件，以及“classes.txt”与“colors.txt”这两个类别与颜色的对应表，请自行参考内容。

不同模型的针对性都不同，例如系统预设的Pascal VOC模型属于比较通用的，其类别与颜色对照表如下：

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

现在以~/jetson-inference/data/images/peds_0.jpg（如下图）为对象，来进行不同模型的测试结果。

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

执行以下指令：

1 2	cd ~/jetson-inference/data/images segnet.py peds_0.jpg segDefault.jpy

执行结果如下图：

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

这边识别出“四个人”并且用对应的颜色显示出来。左边的图就是前面说到“--visualize=overlay”时的表示方法，将颜色与原图进行“重叠（overlay）”显示；右边部分是“--visulaize=mask”的显示结果，只显示检测到的部分，未检测到的地方则全部“遮盖（mask）”掉。

如果将网络模型改成Cityscape的话，看看会呈现怎样的结果？

1	segnet.py peds_0.jpg segCisyscape.jpy --network=fcn-resnet18-cityscapes-512x256

执行结果如下图，在右上角的示图中，好像整个图像都有对应的分类。

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

下面是Cityscape的类别/颜色对照表：

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

看看里面的类别有包括“ground（地面）”、“road（道路）”、“sidewalk（人行道）”、“vegetation（植被）”这些类别，这个模型主要应用在城市交通与建设方面的应用，因此几乎能做到“全景分类”的功能。

接着再试试将网络模型改成Multi-Human类型，执行以下指令：

1	segnet.py peds_0.jpg segMth.jpy --network=fcn-resnet18-mhp-512x320

执行的结果如下图，右上角的示图中也只是将“人”的部分显示出来

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

不过有点特别的是，好像在“人身上”的部分，有更细微的分类，例如图中最明显的“蓝色”部分，对应下面的对照表，发现属于“pants（裤子）”类别；在蓝色底下有“shoe/boot”的颜色分类，左边三个物体的顶端，呈现“face”的颜色分类。

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

这里非常明显地展示出，不同模型有个别的针对重点，例如在支持的模型列表最后面的“SUN RGB-D”，主要针对“室内家具”的分类，其分类颜色类别如下：

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

试试看执行下面指令，会得到怎样的结果：

1	segnet.py peds_0.jpg segSun.jpg --network=fcn-resnet18-sun-512x40

Jetson Nano 2GB 系列文章（24）: “Hello AI World”的物件识别应用

检测出来的结果似乎正确性并不高，如果将测试图片改成room_*.jpg的话，应该会得到比较好的效果，请自行测试一下。

至于下面三个参数的变化，请自行测试：

--visualize参数：可指定为“overlay（重叠）”或“mask（遮盖）”

--alpha参数：主要指定“透明度”，数值越大则透明度越低，预设值为120

--filter-mode参数：指定“过滤模式”，分为“point”与“linear”两种模式

以上就是Hello AI World提供的segnet与segnet.py测试工具的使用方式，至于代码级别的segNet()相对复杂，有兴趣的可以直接参考segnet.py代码，并且参考前面有关imageNet()与detectNet()的代码文章，自行测试看看。

来源：业界供稿

Jetson Nano

0赞

好文章，需要你的鼓励

推荐文章

Anthropic发布入门级Claude Haiku 4.5混合推理模型

人工智能

自然语言处理

成本优化模型

2025-10-16

Anthropic发布入门级Claude Haiku 4.5混合推理模型

Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型，定价为每百万输入令牌1美元，输出令牌5美元，比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构，可根据需求调整计算资源，支持多模态输入最多20万令牌。在八项基准测试中，性能仅比Sonnet 4.5低不到10%，但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上，适用于客服聊天机器人等低延迟应用场景。

上海AI实验室推出科学推理大模型：让AI像科学家一样思考

科学推理

大语言模型

跨学科整合

2025-10-16

上海AI实验室推出科学推理大模型：让AI像科学家一样思考

上海AI实验室联合多家顶尖机构开发出全球首个科学推理大模型SciReasoner，该模型在2060亿科学数据上训练，支持103个科学任务，能够像科学家一样进行逻辑推理并展示思考过程。它实现了化学、生物学、材料科学等多领域知识整合，在分子设计、性质预测、文献分析等方面表现出色，为科学研究提供了强大的AI助手工具。

微软与Nscale签署价值240亿美元数据中心合同

人工智能

数据中心建设

高性能计算芯片

2025-10-16

微软与Nscale签署价值240亿美元数据中心合同

英国初创公司Nscale将为微软建设四个AI数据中心，总计部署约20万个GPU，合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建，配备1.26万个GPU。德州数据中心规模最大，将部署10.4万个GPU，容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。

南洋理工大学团队突破：让AI学会在复杂光影中完美合成图像，无需额外训练就能处理水面倒影和阴影效果

图像合成

深度学习

计算机视觉

2025-10-16

南洋理工大学团队突破：让AI学会在复杂光影中完美合成图像，无需额外训练就能处理水面倒影和阴影效果

南洋理工大学研究团队开发出SHINE方法，这是一种无需额外训练就能实现高质量图像合成的新技术。该方法通过巧妙引导现有AI模型的潜能，能够在复杂光影条件下完美合成图像，包括准确的阴影生成和水面倒影效果。研究团队还创建了ComplexCompo基准测试集，验证了SHINE在各种挑战性场景中的卓越性能，为图像编辑技术的发展开辟了新方向。

2021

07/02

14:59

分享

点赞

最新文章

相关文章

邮件订阅

AI启示录

更多

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

业界热点:

数字化转型

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号京网文(2025) 0096-033号京字第20868号

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　公开举报受理处置规则

网上有害信息举报专区：https://www.12377.cn

安全联盟认证