ZD至顶网服务器频道 01月18日 新闻消息: 英伟达公司在今年的消费电子产品展上公布的联合驾驶员"后座司机"AI可谓一鸣惊人。事实上,大多数与会者都被其在"车"中出色的唇语理解能力所震撼。

根据CES展会上公布的内容,这款联合驾驶员AI助手能够执行四项功能:面部识别、头部追踪、视线追踪与唇语阅读。自动驾驶AI属于GPU助力DRIVE PX 2平台的组成部分,其采用多款传感器以及由英伟达处理器支持的多种神经网络以实现功能。
英伟达公司的一位发言人在采访邮件中确认称,这款唇语阅读组件基于由牛津大学、谷歌DeepMind以及加拿大高级研究所的学者们共同撰写的一篇研究论文。
其实这篇论文在发布之初曾受到批评。虽然其中采用的神经网络LipNet拥有高达93.4%的识别准确率,但其测试场景仅限于一部分特定词汇而非连贯的句子。
在发表于arXiv上的第二篇论文中,我们看到LipNet的能力得到提升。其在通过数个小时的BBC新闻主持人唇部运动解析训练后,现在已经可以解读完整的句子。
英伟达公司的这款联合驾驶员助手显示,LipNet已经进一步获得了理解司机口头命令的能力,因此其能够处理各类常见指令--例如在噪杂的环境下准确选择播放某首曲目。
根据英伟达方面的说法,开发头部与视线追踪以及面部识别功能是为了向用户提供更出出色的安全性与驾驶体验。
"其中包含一套用于实现面部识别的AI,这样车辆就会了解到驾驶员是谁、设定个人偏好且不再需要使用钥匙启动车辆。另一套AI则用于视线追踪,这意味着车辆能够了解到您当前的注意目标,"英伟达公司在一篇博客中解释称。
英伟达公司向来以为游戏及高性能计算用例设计强大的GPU方案而闻名,但其近年来则一直把更多精力用于GPU加速型机器学习与AI的研发当中。“目前梅塞德斯-奔驰、奥迪、特斯拉以及丰田都已经成为该项新技术的客户,”一位英伟达公司发言人确认道。
好文章,需要你的鼓励
IBM在量子开发者大会上发布两款新型量子处理器。Quantum Nighthawk配备120个量子比特和218个新一代可调耦合器,比前代产品增加20%耦合器,可执行复杂度提升30%的电路。Quantum Loon是实验性处理器,展示了实现极低错误率和高效错误恢复的所有组件。IBM计划2026年底确认首批量子优势案例,并于2029年交付大规模容错量子计算平台。
腾讯研究团队提出GCPO算法,通过引入"黄金答案"解决小型语言模型推理能力不足问题。当传统对比学习失效时,该方法为模型提供正确示例指导,在多个数学推理基准上取得25%-54%的性能提升,为小型模型突破能力边界提供了新思路。
VDURA数据平台第12版本通过扩展元数据计算、添加系统级快照功能和支持叠瓦磁记录硬盘来降低每TB成本。新版本引入弹性元数据引擎,可动态扩展元数据节点,将元数据操作性能提升最多20倍。快照功能支持即时的节省空间的数据集时点副本。SMR硬盘支持通过智能写入放置引擎,在不影响吞吐量的情况下每机架增加25-30%容量。
上海人工智能实验室联合多家机构推出MUSE框架,首次实现AI助手的经验学习与自我进化能力。MUSE采用三层记忆架构,通过"计划-执行-反思-记忆"循环,让AI能够像人类一样从工作中积累经验。在TAC基准测试中,MUSE创造性地达到51.78%成功率,成为首个突破50%大关的系统,标志着AI助手从静态工具向智能伙伴的重要转变。