作者: 安森美智能感知事业部Geoff Ballew
如今,摄像头已随处可见,工厂、车辆、公共建筑、街道……其数量还在不断增多。大部分摄像头依靠图像传感器将场景中的光线转换为电子图像,因而推升了对图像传感器的需求。但图像传感器种类繁多,功能特性各不相同,设计人员需要熟悉不同传感器的不同功能特性,才能为特定应用选择合适的摄像头。
乘用车摄像头搭载量激增,有些豪华车型甚至配有十几个摄像头。汽车制造商需要添加更多传感器以提升安全性,还需考虑每个摄像头的经济成本和占用空间,这为其带来了挑战。于是,汽车制造商开始寻找解决方案,希望用一个摄像头捕获同时针对人眼视觉和机器视觉优化的图像。人眼视觉与机器视觉所适用的图像质量存在区别,需要权衡取舍,因此实施这一方法同样难度不小。
人眼视觉
人眼视觉系统对像素间亮度强弱差异的感知与机器视觉算法不同。人眼对亮度的感知是非线性的,也就是说,如果所在环境中光子数量增加一倍,眼睛感知到的亮度也只增加了一倍。这需要调整用于人眼视觉的摄像头图像以对应其动态范围,从而将人眼感知的较亮区域和较暗区域的细节充分放大。此外,我们对一般颜色和 LED 光源的闪烁十分敏感(这一问题日益普遍),因此如果摄像头导致颜色失真,即使图像清晰且其他方面的质量很高,也会影响人类的视觉体验。对于后视摄像头等辅助驾驶的被动安全系统,驾驶员也比机器视觉系统有优势,因为如果图像有缺,驾驶员会自动发现,而此时无需依赖摄像头。虽然这不会引发重大安全事故,但摄像头丧失用处也会带来不便,因此,驾驶员不会依赖摄像头图像,而是更多地进行主动判断。
机器视觉
与人眼视觉不同,使用机器视觉的自动化系统会查看图像中每个像素的数字值,因此其对光子数呈线性反应。与用于人眼视觉的图像不同,因此必须调整以输出对应于测量像素值的图像。此外,机器视觉系统必须经过编程或采用特殊的错误检测硬件才能检测出图像缺陷。缺少该硬件的系统可能无法正常工作,且不会告知驾驶员其功能已受损或无法运行。对于像自动紧急制动这样的主动安全系统,如果出现故障,误报将导致系统在无碰撞危险时实施制动,而漏报会使系统在发生危险时完全失灵,从而造成严重的后果。如果驾驶员使用此类辅助系统,则需要显示信息来指示其功能不全,但可能无法发出功能受损的警告。部分系统会提醒驾驶员其功能受损或“不可用”,它们通常依赖特殊的硬件功能来检测传感器中的错误或故障。此类功能须遵循汽车安全完整性等级 (ASIL) 等相关的行业标准,支持 ASIL 的传感器将具有检测和报告故障的功能,可提高安全性。以上就是用于机器视觉的传感器与用于人眼视觉的传感器需要进行不同配置的两个原因。

120 度视场传感器 RYYCy 图像,经过彩色处理
使用单个摄像头实现观察和感知的传感器解决方案
好消息是,部分传感器已具备同时适用于人眼和机器视觉的出色功能,且可进行优化并输出两路同步数据流,助力工程师设计可同时用于人眼和机器视觉功能的摄像头系统。这样一来,汽车制造商只需在车内的特定位置部署一个摄像头,最大限度地减小占用空间并降低系统成本,获得可针对两种工作负载应用优化的图像。
好文章,需要你的鼓励
微软宣布未来四年将在阿联酋投资152亿美元,包括首次向该国运输最先进的英伟达GPU芯片。美国已授权微软向阿联酋出口英伟达芯片,使该国成为美国出口管制外交的试验场和地区AI影响力锚点。这笔投资包括2023年以来的73亿美元支出和2026-2029年的79亿美元计划投入,涵盖数据中心建设、人才培训和AI基础设施扩展,目标到2027年培训100万当地居民。
NVIDIA联合多伦多大学开发的ChronoEdit系统通过将图像编辑重新定义为视频生成问题,让AI具备了物理常识。该系统引入时间推理机制,能够想象编辑的完整变化过程,确保结果符合物理规律。在专业测试中,ChronoEdit超越了所有开源竞争对手,特别在需要物理一致性的场景中表现突出,为自动驾驶、机器人等领域的应用提供了重要技术突破。
OpenAI与亚马逊云服务签署七年380亿美元协议,在微软Azure之外增加另一个超大规模云服务商来满足其不断增长的AI计算需求。该协议将让OpenAI立即获得AWS EC2 UltraServers访问权限,计算能力将在未来七年内扩展至数千万个CPU。AWS还将为OpenAI构建基于英伟达Blackwell芯片的定制基础设施。尽管签署了这一大额协议,OpenAI仍将继续依赖微软Azure作为其主要云计算合作伙伴。
这项研究提出了MITS框架,使用信息论中的点互信息指导AI推理过程,解决了传统树搜索方法计算成本高、评估标准模糊的问题。通过动态采样和加权投票机制,MITS在多个推理数据集上显著超越现有方法,同时保持高效的计算性能,为AI推理技术开辟了新方向。