北京—2017年10月10日——NVIDIA于今日发布了全球首台为完全自动驾驶出租车而设计的AI计算机。
代号为Pegasus的全新系统扩展了NVIDIA DRIVE PX AI计算平台,可以处理L5无人驾驶汽车。NVIDIA DRIVE PX Pegasus的每秒操作超过320万亿次——比其前身NVIDIA DRIVE PX 2的性能超出10倍以上。
NVIDIA DRIVE PX Pegasus将有助于使无人驾驶这一新型汽车——没有方向盘、踏板或汽车视镜且内部如同客厅或办公室的完全自动驾驶汽车——成为可能。此类汽车将按需抵达,安全将乘客送达目的地,从而让每个人(包括老年人和残疾人)享受移动出行。
驾驶员可以利用节省下来的数百万小时在日常通勤中工作、娱乐、用餐或睡觉。这种永不疲劳、不受损害且不会分心的汽车将挽救无数生命——同时提高道路安全性、减少拥堵、释放被停车场占用的宝贵土地。
在利用NVIDIA DRIVE PX平台进行开发的225个合作伙伴中,有超过25家正利用NVIDIA CUDA GPU开发完全自动驾驶出租车。现在,此类车辆的后备箱类似于小型数据中心,装在配备服务器级NVIDIA GPU的计算机机架上,以运行深度学习、计算机视觉和并行计算算法。此类车辆的尺寸、功率需求和成本导致它们并不适合大批量生产。
自动驾驶出租车的计算需求巨大——通过高清的360度环绕摄像机和激光雷达感知周围环境、对车辆进行厘米级高精度定位、追踪周围车辆和人员、规划前往目的地的安全舒适路线。所有这些处理必须通过多级冗余来实现,以确保最高安全级别。无人驾驶汽车的计算需求强度比目前最先进的汽车高50到100倍。
NVIDIA创始人兼CEO黄仁勋表示:“创造完全自动驾驶汽车是全社会最重要的事业之一,也是最难完成的挑战之一。Pegasus的突破性AI计算性能和效率对于该行业实现此愿景至关重要。”
“无人驾驶汽车将提供新的乘车和拼车服务。它将创造出全新车型,犹如置于车轮上的办公室、客厅或酒店房间。出行者只需根据目的地和沿线的出行活动来订购想要的车型。社会的未来将因而被重塑。”
几乎所有汽车制造商、运输服务公司和初创公司都在使用NVIDIA AI来开发L5车辆。
NVIDIA DRIVE PX Pegasus由四个高性能AI处理器提供动力。它搭载了NVIDIA两款最新的Xavier系统级芯片处理器——包括基于NVIDIA Volta架构的嵌入式GPU——具备两个新一代独立GPU以及为加快深度学习和计算机视觉算法而创造的硬件。该系统将通过一个车牌大小的计算机,为完全自动驾驶汽车提供强大的计算能力,大幅降低能耗和成本。
Pegasus依据业界最高安全级别的ASIL D认证要求而设计,配备汽车输入/输出,包括CAN(控制器局域网)、Flexray、用于摄像机、雷达、激光雷达和超声波的16个专用高速传感器输入以及多个10Gbit以太网络连接器。其组合内存带宽为每秒超过1TB。
NVIDIA DRIVE PX平台从实现L2+/L3功能的单个移动处理器配置扩展为针对完全L5的多个移动处理器和独立GPU组合。这些配置在单一的开放软件架构上运行。这使得汽车制造商和tier1供应商能够从开发阶段转入实现各种自动驾驶解决方案的生产阶段——从高速公路上的AutoCruise到点到点行程的AutoChauffeur,再到针对完全无人驾驶汽车的Pegasus。
NVIDIA DRIVE PX是NVIDIA AI计算解决方案系统中的一员。在NVIDIA DGX-1 AI超级计算机的数据中心训练深层神经网络的数据科学家们可以在车辆内无缝运行NVIDIA DRIVE PX。统一的架构让同样的NVIDIA DRIVE软件算法、数据库和工具既能在数据中心内运行也能在车内实现推理。
通过这种“云到车”的方法,无人驾驶汽车能够在整个生命周期内进行网络更新,从而添加新的功能特征。
Pegasus将于2018年下半年正式向NVIDIA汽车合作伙伴提供。NVIDIA DriveWorks软件和NVIDIA DRIVE PX 2配置现已经提供给从事自动驾驶汽车和算法的开发人员使用。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。