英伟达发布“后排驾驶员”AI，能够学习阅读唇语

英伟达公司在今年的消费电子产品展上公布的联合驾驶员"后座司机"AI可谓一鸣惊人。事实上，大多数与会者都被其在"车"中出色的唇语理解能力所震撼。

ZD至顶网服务器频道 01月18日新闻消息：英伟达公司在今年的消费电子产品展上公布的联合驾驶员"后座司机"AI可谓一鸣惊人。事实上，大多数与会者都被其在"车"中出色的唇语理解能力所震撼。

根据CES展会上公布的内容，这款联合驾驶员AI助手能够执行四项功能：面部识别、头部追踪、视线追踪与唇语阅读。自动驾驶AI属于GPU助力DRIVE PX 2平台的组成部分，其采用多款传感器以及由英伟达处理器支持的多种神经网络以实现功能。

英伟达公司的一位发言人在采访邮件中确认称，这款唇语阅读组件基于由牛津大学、谷歌DeepMind以及加拿大高级研究所的学者们共同撰写的一篇研究论文。

其实这篇论文在发布之初曾受到批评。虽然其中采用的神经网络LipNet拥有高达93.4%的识别准确率，但其测试场景仅限于一部分特定词汇而非连贯的句子。

在发表于arXiv上的第二篇论文中，我们看到LipNet的能力得到提升。其在通过数个小时的BBC新闻主持人唇部运动解析训练后，现在已经可以解读完整的句子。

英伟达公司的这款联合驾驶员助手显示，LipNet已经进一步获得了理解司机口头命令的能力，因此其能够处理各类常见指令--例如在噪杂的环境下准确选择播放某首曲目。

根据英伟达方面的说法，开发头部与视线追踪以及面部识别功能是为了向用户提供更出出色的安全性与驾驶体验。

"其中包含一套用于实现面部识别的AI，这样车辆就会了解到驾驶员是谁、设定个人偏好且不再需要使用钥匙启动车辆。另一套AI则用于视线追踪，这意味着车辆能够了解到您当前的注意目标，"英伟达公司在一篇博客中解释称。

英伟达公司向来以为游戏及高性能计算用例设计强大的GPU方案而闻名，但其近年来则一直把更多精力用于GPU加速型机器学习与AI的研发当中。“目前梅塞德斯-奔驰、奥迪、特斯拉以及丰田都已经成为该项新技术的客户，”一位英伟达公司发言人确认道。

来源：ZD至顶网服务器频道

0赞

好文章，需要你的鼓励

英伟达发布“后排驾驶员”AI，能够学习阅读唇语

来源：ZD至顶网服务器频道

2017

01/18

10:36

分享

点赞

稚晖君发布全球最小全身力控人形机器人，上纬启元开启个人机器人时代

2026年软件定价大洗牌：IT领导者必须知道的关键变化

Linux 在 2026 年将势不可挡，但一个开源传奇可能难以为继

CES 2026趋势展望：全球最大科技展五大热门话题预测

人工智能时代为何编程技能比以往更重要

AI颠覆云优先战略：混合计算成为唯一出路

谷歌发布JAX-Privacy 1.0：大规模差分隐私机器学习工具库

谷歌量子AI发布新型优化算法DQI：量子计算优化领域的重大突破

缓解电动汽车里程焦虑：简单AI模型如何预测充电桩可用性

Titans + MIRAS：让AI拥有长期记忆能力

Gemini为STOC 2026大会理论计算机科学家提供自动化反馈

夸克AI眼镜持续升级：首次OTA，支持89种语言翻译

2025年度凌云奖揭晓，200万AI从业者共同定义“好产品”

火山引擎成为总台春晚独家AI云合作伙伴，助力打造科技春晚新体验

AI驱动企业级SSD变革：闪迪公司的创新与实践

开箱 NVIDIA DGX Spark： 把'一千万亿次'运算，“塞进”iPad mini大小的盒子里

AI“好产品”的年度答案，2025年度凌云奖即将揭晓

自研架构升级，跨越“万卡”天堑 摩尔线程在物理AI时代开启“成人礼”

智算中心进化论，科华数据如何做到“更懂”

火山引擎：AI不再只是技术潜力，Agent成为下一个战场

智能化与全球化并进，IBM中国下一个40年思考

Arm 借助融合型 AI 数据中心，重塑计算格局

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

开箱 NVIDIA DGX Spark：把'一千万亿次'运算，“塞进”iPad mini大小的盒子里

自研架构升级，跨越“万卡”天堑摩尔线程在物理AI时代开启“成人礼”