作者: 安森美智能感知事业部Geoff Ballew
如今,摄像头已随处可见,工厂、车辆、公共建筑、街道……其数量还在不断增多。大部分摄像头依靠图像传感器将场景中的光线转换为电子图像,因而推升了对图像传感器的需求。但图像传感器种类繁多,功能特性各不相同,设计人员需要熟悉不同传感器的不同功能特性,才能为特定应用选择合适的摄像头。
乘用车摄像头搭载量激增,有些豪华车型甚至配有十几个摄像头。汽车制造商需要添加更多传感器以提升安全性,还需考虑每个摄像头的经济成本和占用空间,这为其带来了挑战。于是,汽车制造商开始寻找解决方案,希望用一个摄像头捕获同时针对人眼视觉和机器视觉优化的图像。人眼视觉与机器视觉所适用的图像质量存在区别,需要权衡取舍,因此实施这一方法同样难度不小。
人眼视觉
人眼视觉系统对像素间亮度强弱差异的感知与机器视觉算法不同。人眼对亮度的感知是非线性的,也就是说,如果所在环境中光子数量增加一倍,眼睛感知到的亮度也只增加了一倍。这需要调整用于人眼视觉的摄像头图像以对应其动态范围,从而将人眼感知的较亮区域和较暗区域的细节充分放大。此外,我们对一般颜色和 LED 光源的闪烁十分敏感(这一问题日益普遍),因此如果摄像头导致颜色失真,即使图像清晰且其他方面的质量很高,也会影响人类的视觉体验。对于后视摄像头等辅助驾驶的被动安全系统,驾驶员也比机器视觉系统有优势,因为如果图像有缺,驾驶员会自动发现,而此时无需依赖摄像头。虽然这不会引发重大安全事故,但摄像头丧失用处也会带来不便,因此,驾驶员不会依赖摄像头图像,而是更多地进行主动判断。
机器视觉
与人眼视觉不同,使用机器视觉的自动化系统会查看图像中每个像素的数字值,因此其对光子数呈线性反应。与用于人眼视觉的图像不同,因此必须调整以输出对应于测量像素值的图像。此外,机器视觉系统必须经过编程或采用特殊的错误检测硬件才能检测出图像缺陷。缺少该硬件的系统可能无法正常工作,且不会告知驾驶员其功能已受损或无法运行。对于像自动紧急制动这样的主动安全系统,如果出现故障,误报将导致系统在无碰撞危险时实施制动,而漏报会使系统在发生危险时完全失灵,从而造成严重的后果。如果驾驶员使用此类辅助系统,则需要显示信息来指示其功能不全,但可能无法发出功能受损的警告。部分系统会提醒驾驶员其功能受损或“不可用”,它们通常依赖特殊的硬件功能来检测传感器中的错误或故障。此类功能须遵循汽车安全完整性等级 (ASIL) 等相关的行业标准,支持 ASIL 的传感器将具有检测和报告故障的功能,可提高安全性。以上就是用于机器视觉的传感器与用于人眼视觉的传感器需要进行不同配置的两个原因。
120 度视场传感器 RYYCy 图像,经过彩色处理
使用单个摄像头实现观察和感知的传感器解决方案
好消息是,部分传感器已具备同时适用于人眼和机器视觉的出色功能,且可进行优化并输出两路同步数据流,助力工程师设计可同时用于人眼和机器视觉功能的摄像头系统。这样一来,汽车制造商只需在车内的特定位置部署一个摄像头,最大限度地减小占用空间并降低系统成本,获得可针对两种工作负载应用优化的图像。
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。