说到美国拉斯维加斯,你会想到什么?
其实除了众人皆知的赌场,每年在这里举办的CES也让这里成了狂欢的不夜城。
2024年1月9日至1月12日,全球科技巨头齐聚CES 2024国际消费电子展,共商揭晓未来科技风向。各大芯片、手机、PC、汽车等企业将展示引领潮流的创新技术。
时隔三年,笔者再次出发,即将踏上CES 2024之旅。对于CES 2020,我还记忆犹新,当时到处是各大中国企业的身影。
但是当来到2024年,这一届的CES却给我带来了三大期待:
1、人工智能是大热门,过去一年生成式AI持续火爆,百模大战在中国上演。国外也是同样在大语言模型方面你追我赶。
对于CES来说,各种细分场景的展品展示肯定少不了,那么大模型会有哪些新的玩法呢,这很值得期待。
在即将到来的CES 2024上,我们将有机会看到全球最前沿的人工智能应用案例,包括但不限于AI医疗、AI陪伴、AI教学、家居互联,以及具有类似功能的人形机器人与具身智能。这些创新的应用将为我们的生活带来更多的便利和可能性。
2、还是大模型,当大模型来到PC,也就催生了AI PC。众所周知,过去一年不管是手机还是PC市场依然很低迷,业界迫切需要强心针提振市场。在这种情况下,AI PC成为焦点。
从目前网上公布的信息来看,AI PC会是CES 2024的重点,不管是英特尔还是AMD,还是联想、惠普、戴尔等企业都会展出AI PC产品,这也值得期待。
3、CES除了是知名的消费电子展,业界还有一个说法是车展。因为在CES上,众多车企会展出极具想象力的概念车,从而引领产业风向。
奔驰宣布会在本次CES期间,发布最新一代的MBUX人机交互系统,号称将把语音助手带入全新的维度。
我国在新能源汽车领域实现了超车,而国外车企对于未来汽车又有哪些新的思考呢?这也值得期待。
今年CES的技术主题,还覆盖了机器人、无人机、AR/VR、数字健康、智慧城市、智慧家居等数十项。
带着三大期待,我即将开始CES 2024之旅。欢迎持续关注至顶网,以及我们带来的前方一手消息。
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。