在世界移动通信大会(MWC)上,基于与高通多年的合作沉淀,Prophesee 展示了新一代无模糊的手机摄影技术。目前客户可将该技术集成到支持第三代骁龙 8 移动平台的设备中。
2024 年 2 月 27 日,中国上海——领先的神经拟态视觉传感公司 Prophesee 今日宣布,与高通技术公司的合作进入可量产阶段。在巴塞罗那世界移动通信大会(MWC)期间,Prophesee 展示了其解决方案与骁龙®旗舰移动平台的原生兼容性,以及神经拟态视觉技术为智能手机摄像头带来的速度、能效和成像质量方面的提升。
图 1: 高通在骁龙峰会主会场介绍 Prophesee Metavision 解决方案
Prophesee Metavision 事件视觉传感器和人工智能算法针对骁龙平台进行了优化,使运动模糊消除(motion blur cancellation)的效果和整体图像的质量都得到前所未有的提升,尤其是在快速移动和低光等传统基于帧的 RGB 传感器难以应对的场景中。
图 2、3、4:使用 Metavision 传感 + AI算法,在搭载第三代骁龙 8 移动平台的设备上拍摄世界著名的巴黎歌剧院芭蕾舞团的舞者,实现去模糊效果
Prophesee 首席执行官兼联合创始人 Luca Verre 表示:“自 2023 年 2 月宣布合作以来,如今我们已取得了重大进展,证明了 Prophesee 事件视觉技术对提升搭载骁龙移动平台智能手机影像质量的显著作用,这是里程碑式的技术进步。现在,我们很高兴宣布 Metavision Deblur 解决方案已准备就绪,可投入生产。我们期待通过 Prophesee Metavision 解决方案为新一代智能手机解锁更强大的影像和视频功能。”
高通技术公司产品管理副总裁 Judd Heape 表示:“我们很高兴继续与 Prophesee 保持紧密合作,协力推动 Prophesee Metavision 事件视觉技术与第三代骁龙 8 旗舰移动平台的无缝兼容。这将显著提升手机影像质量,同时为搭载骁龙移动平台的智能设备解锁更多基于事件相机的免快门功能的新潜能。”
工作原理
Prophesee 突破性的事件视觉传感器能够为手机摄影提供全新的感知维度。由于事件视觉传感仅关注场景中的动态变化,能够迅速响应并连续追踪像素变化,从而打破了传统的成像范式。
Metavision 传感器中的每个像素都有一个内嵌的逻辑核(logic core),使其能够作为神经元来工作。 每个像素都能根据各自感应到的光子数量,异步且智能地激活自身。像素的每次激活称为一个“事件(event)”,因此在本质上,事件是由场景动态驱动的,其采集速度也始终与实际场景动态相匹配。
通过同步 Prophesee 事件传感器和基于帧的传感器的数据,手机摄影可以实现高性能的图像去模糊。系统能够将事件传感器以微秒为单位记录的事件填充到两帧图像的间隙,通过算法提取纯动态信息,从而修复运动模糊。
关于手机应用的更多详细信息,请访问:https://www.prophesee.ai/event-based-vision-mobile/
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。