在世界各地,每年有130多万起致命的汽车碰撞事故。这其中包括易受伤害的道路使用者,如骑自行车的人、行人和骑摩托车的人。IEEE会员Bilin Aksun-Guvenc认为,事故可通过智能手机数据显著减少,尤其关注弱势道路使用者。
Aksun-Guvenc的研究使用智能手机数据向驾驶员和自动驾驶汽车告知碰撞风险。
智能手机配备了一系列传感器,包括GPS、加速度计、陀螺仪、步进计数器和光传感器,可以测量易受伤害的道路使用者的运动。通过智能手机应用程序,这些数据可以精确定位用户的位置、未来位置和出行方向,然后通过空中连接将其广播给车辆。
为什么汽车制造商不直接使用机器视觉来识别行人和其他弱势道路使用者?
汽车制造商确实使用机器视觉和现有的车辆摄像头进行保护,但这些系统无法看到拐角处或通过障碍物,因为它们需要一条视线来检测用户。视觉传感器也会受到照明和天气条件的影响;例如,一些车道保持辅助系统在雨中停用。通信系统较少受到这些条件的阻碍,可以补充机器视觉以改善用户跟踪。
那么,行人的智能手机上需要一个特殊的应用程序吗?司机需要什么吗?这会成为汽车的标准功能吗?
同样的应用程序可以在驾驶员的智能手机上以及易受伤害的道路用户的设备上运行。由于许多用户已经拥有智能手机,因此将这项技术集成到生产车辆中是很简单的。该系统,尤其是2级自动化车辆,可以显著增强防撞措施。
用户的手机如何与车辆通信?
低能耗蓝牙是一个可行的选择,因为它的功耗最小。它允许“广告模式”,即手机在不配对的情况下广播数据,维护用户隐私。也就是说,该技术在通信技术方面是不可知的。蜂窝技术也可以在没有显著延迟影响的情况下实现这一目的。
有可能将这个系统集成到非手机设备中吗?
当然,推荐使用。建筑工人可以携带类似于数字安全背心的信标,而骑自行车的人可以将该系统集成到GPS设备中。这种简单的指路明灯方法将使没有智能手机的儿童受益。
您在设计此系统时面临了哪些挑战?
为了完善我们的方法并评估其全部潜力,有必要在现实世界中部署大量用户。智能手机GPS精度和通信延迟等问题可能会导致误报和漏报,但这些都是可以解决的问题。
这个系统还包括其他应用程序吗?
该系统的通信功能可以在各种情况下提供帮助,例如在大学校园里引导送餐机器人,这些机器人在等待穿过路口时经常堵塞坡道。更好的车辆通信可以缓解这种情况。此外,车与车之间的合作可以增强城市的机动性,有可能取代十字路口的物理交通信号灯。
了解更多:是什么让自动驾驶汽车安全?我们期望他们有多安全?IEEE标准协会致力于根据跟车、道路共享、行人情况、十字路口场景和能见度问题,包括考虑道路规则及其区域和/或时间相关性,为自动驾驶汽车制定最佳安全实践。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。