随着终端侧设备的AI计算能力的不断提升,在5G手机、PC、智能汽车等终端侧运行生成式AI已经成为人工智能加速落地的重要路径。对于高通而言,其跨终端的芯片为其提供了先天的优势,拓宽了端侧生成式AI应用场景。
从工业时代到数字时代,汽车的产品形态、驾驶方式、功能操作都在发生着剧烈的变化,车辆从被动式的纯机械化操作方式到主动式的数字化主导。
底盘是汽车的核心部件之一,它承载了汽车的动力系统、转向系统、制动系统、悬架系统等,决定了汽车的运动性能、稳定性和安全性。随着汽车工业的发展,底盘系统也经历了从机械时期到机电混合时期再到智能时期的演变。
如果说工业时代,汽车的底盘考验了车厂的能力。那么数字时代,数字底盘成为汽车的新标配。为此,高通推出了骁龙数字底盘,包括数字座舱、车联网技术、网联服务、先进驾驶辅助与自动驾驶系统。
边缘侧生成式AI驱动的数字座舱
智能座舱正在从以功能性需求为主,向以“用户体验”为核心的方向演进。对于座舱芯片,骁龙8155是业界的标志性产品,而骁龙8295则是第四代骁龙座舱平台。
座舱事关车内体验,笔者在现场的高通骁龙数字底盘概念车上真实体验了骁龙座舱平台,其通过引入生成式AI技术极大革新了车内体验。
随着AI的流行,边缘侧生成式AI将在座舱中有了更多用武之地,例如车内人员可以动动嘴就可以完成以往需要动手的操作。
在概念车上,工作人员就为笔者展示了骁龙数字底盘的如下功能表现:
出行指南——利用数字助手帮助规划出行。减少时间和复杂性,让数字助手根据用户的出行偏好进行搜索研究。
用户指南——可以访问电子版用户手册,为用户提供希望寻找的所有详细信息。AI助手会读出详细信息,在汽车显示屏上显示详情。
预测性维修——好奇仪表盘上警示灯是什么意思?问问数字助手,它不仅会告诉用户警示灯的含义,还会帮助用户寻找最近的经销商以便前往维修,甚至帮助用户安排预约。
座舱控制和通用语音查询——用户专心看路开车,可以让虚拟助手调高座舱温度,或询问虚拟助手下周天气如何。
你或许会说这些功能现在的车辆很多实现了,其实实现是一回事,而好用是另外一回事。笔者在跟随工作人员的演示中体会到经过生成式AI加持的这些所谓已有功能场景实现实现了质的提升。
就拿出行指南来说,现在的车机导航虽然也能记住你的出行偏好,但是往往需要进行手动设置,而生成式AI可以学习你的线路数据,进而更精准预测你的出行习惯。
也就是说智能座舱的交互模式,开始逐步从过去用户被动接受车机端提供的特定内容服务转向更多主动交互场景的部署,不仅精准识别用户的行为,还通过多维度输入理解用户的意图。
至今已有超过3.5亿辆汽车采用骁龙数字底盘解决方案,包括小米SU7、新奔驰E级、蔚来ET9、小鹏X9、极越01、极氪001FR和极氪007、银河E8、零跑C10等已经搭载骁龙8295,为座舱在功能创新和体验升级带来新范例。
从车端到PC、移动终端
我们都说汽车是大号的移动终端,除了在车端引入生成式AI技术,高通也在移动终端侧(手机和PC)引入生成式AI。
经过优化,类似Stable Diffusion这样的生成式AI应用如果通过云端计算,需要几百瓦的功率,但在骁龙平台的支持下,在终端设备能够实现仅毫瓦级别的功耗。
例如在手机领域,各大手机厂商近期的产品宣传点就是与大语言模型的结合,而搭载第三代骁龙8的手机终端能够运行高达100亿参数的生成式AI模型,以每秒20个tokens的速度运行大语言模型。通过在终端侧运行这些强大的大型模型,用户无需再完全依赖云端。
今年早些时候,高通带来了全球首个利用Stable Diffusion进行图像生成的终端侧部署技术演示,该演示完全在终端侧运行,用时不超过15秒。通过第三代骁龙8,骁龙正在为AI手机的性能表现树立全新标杆——第三代骁龙8运行这一模型仅需约0.5秒。
在PC领域,如今AI PC成为业界讨论的热点,未来PC与生成式AI的结合是必然。不甘心于移动终端,高通也开始拓展PC市场,推出了骁龙X Elite,其配备了独立的NPU,结合CPU以及GPU,支持在终端侧运行超过130亿参数的生成式AI模型。
不管是手机还是PC,芯片层面的性能优化来实现生成式AI模型的就绪是共识。而凭借海量的终端设备,高通已经具备了实现生成式AI大规模落地的硬件基础。
除此以外,在软件侧,高通AI软件栈是端到端的AI软件解决方案,可通过统一的软件栈整合高通AI软件功能,支持智能手机、汽车、PC等多个产品线。
结语
业界普遍认为今年CES展会的一大主题是AI,特别是大语言模型和生成式AI,从笔者这几日的参展体会是将技术和概念落地为具体可感的产品才是今年参展企业的重点。
这其中以端侧AI的落地更快,包括PC和手机等设备,乃至汽车。不过这有赖于底层硬件的优化,于是我们便看到不管是英特尔还是AMD、NVIDIA、高通等都在赋予芯片更多AI加速功能,支撑上层智能应用。
在智能座舱方面,高通的表现业界有目共睹。市场机会涌现,英特尔也开始进军汽车AI芯片,将发布一系列AI软件定义汽车系统芯片(SDV SoC),与高通和英伟达展开竞争。
生成式AI实现不同以往的智能效果,而高通凭借海量的硬件终端可以将生成式AI在不同的端侧实现畅通无阻,这也就打开了巨大的想象空间。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。