图片来源:宝马集团
想象一下,你驾驶着一辆没有自动驾驶功能的汽车去商场、机场或停车场,然后使用一个应用程序就能够让汽车自己去停车。
软件公司Seoul Robotics正利用NVIDIA技术,使“非自动驾驶汽车变成自动驾驶汽车”成为可能。
这家总部位于韩国的公司最初专注于改善第一公里和最后一公里的物流,例如停车。其Level 5 Control Tower 是一个由传感器和计算机组成的网状网络,这些传感器和计算机被放置在建筑物、灯杆等设施周围的基础设施上(而非汽车上),用来捕捉无阻挡的环境视图。
该系统通过指示汽车与外界的信息交换,即所谓V2X、通信系统,使汽车能够自主移动。这些系统实现了车辆与基础设施、其他车辆和周围任何实物之间的信息双向传递。V2X技术是许多现代汽车的标准配置,用于提高道路安全和通行效率并实现节能。
Seoul Robotics的平台LV5 CTRL TWR使用摄像头和激光雷达收集环境的三维数据。计算机视觉和基于深度学习的AI对数据进行分析,确定车辆在覆盖区域内最高效、安全的路径。
然后该平台通过V2X管理汽车上的功能,例如自适应巡航控制、车道保持和制动辅助功能,使汽车能够安全地从一个地方移动到另一个地方。
LV5 CTRL TWR是由用于创建GPU加速应用的NVIDIA CUDA库以及用于边缘高性能AI的NVIDIA Jetson AGX Orin模块构建的。NVIDIA GPU 在云端用于全局车队路径规划。
Seoul Robotics是NVIDIA Metropolis(一项专注于通过应用框架和开发者工具组来大力推动视觉AI应用发展的合作计划)和NVIDIA初创加速计划(一项培养尖端初创企业的全球免费计划)成员。
通过基础设施实现自动驾驶
Seoul Robotics正在开辟一条通往L5级自动驾驶,即全自动驾驶的新道路——“通过基础设施实现自动驾驶”。
Seoul Robotics产品和解决方案副总裁Jerone Floor表示:“我们的传感器不是安装在车辆上,而是安装在周围的基础设施上。”
LV5 CTRL TWR使用V2X功能从基础设施向汽车发送使车辆向右或向左转弯、从A点移动到B点、制动等指令。该系统的汽车定位精度达到正负四厘米。
Floor表示:“不管一辆车有多智能,它都无法看到从拐角处过来的另一辆车。LV5 CTRL TWR为车辆提供整体环境视图中的所有信息,避免产生盲区。”
他还表示,大多数车辆都已拥有这些通信协议。LV5 CTRL TWR担任的是指示机制的AI大脑,只需要更新汽车固件即可。
Floor表示:“从一开始我们就知道我们的系统需要通过深度学习才能实现达到目标安全性所需的真正高性能,为此我们需要GPU加速。于是我们从头到尾都是基于NVIDIA GPU和CUDA来设计这个系统。”
NVIDIA CUDA库帮助Seoul Robotics团队实时渲染来自3D传感器的大量数据并加速其深度学习模型的训练和推理。
作为Metropolis成员,Seoul Robotics提前获得了软件开发工具包和用于边缘AI的NVIDIA NVIDIA Jetson AGX Orin。
Floor表示:“凭借Jetson AGX Orin的算力,单个LV5 CTRL TWR模块能够覆盖更大的区域。另外,它能够适应的温度范围很广,因此无论是雨天还是晴天,我们的系统都能够在室内和室外装置中正常运行。”
推广到全球
LV5 CTRL TWR目前正在慕尼黑的一家宝马工厂进行早期商业化部署。
Floor表示,汽车在生产后会经常更换地点,从电气维修站到用于试车的停车场等。
在配备LV5 CTRL TWR后,宝马工厂实现了汽车移动的自动化,节省了时间和成本。Floor表示,汽车转移自动化还提高了员工的安全,使他们能够专注于车头灯校准等其他工作。
一辆车从完成生产到交付给客户平均需要经过七个停车场,而人工移车的成本是每辆汽车每个停车场30至60美元,也就是说LV5 CTRL TWR面对的是一个300亿美元的市场。
Floor强调,LV5 CTRL TWR背后的技术可用于各个行业。除了汽车工厂之外,Seoul Robotics还计划将其平台部署到全球各地的零售店、机场、交通路口等。
NVIDIA Jetson AGX Orin 32GB量产级模组现已上市。
进一步了解NVIDIA Metropolis并申请加入NVIDIA初创加速计划。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。