思科公司将于下周公布其“星舰”项目(Starship),并承诺这套方案将允许UCS服务器及其HyperFlex超融合型设备实现更为强大与易用的自动化能力,无论其运行环境为数据中心、远程办公环境抑或是小型企业。
截至本文撰稿时,与星舰项目相关的资料仍然非常有限。但下周的思科Live!会议上将设置题为“思科UCS:通往全面自动化之路”的对话,交换机巨头将借此“与我们分享推动数据中心自动化步入下一阶段的展望与战略规划。”
思科公司认为,“预计性分析与自主功能的出现意味着AI完全有可能在IT领域拓展新的业务空间”,其同时承诺发布“架构与路线图”信息以把握这些关键性机遇。
该公司亦将星舰项目描述为面向UCS与HyperFlex的“下一代云管理”方案,旨在“提供更快部署速度、更简运营流程以及更为丰富的分析能力,且特别适用于多站边缘环境。”
这里提到的边缘因素非常重要,因为在下周的星舰项目之前,思科公司还曾经公布过面向远程办公环境的新型HyperFlex产品的相关消息。
这套新型HX220c节点中包含两块至强E5-2600 v4处理器,且可配备最高1.5 TB内存以及六块磁盘驱动器——可选用1.2 TB机械磁盘或者3.8 TB SSD。另外,思科将同时推出普通版本与全闪存版本。
思科公司认为大多数客户都会在该设备上运行vSphere,因此提供了两张FlexFlash SD卡用于进行启动。在连接方面,这台设备采用2 x 10千兆以太网与FCoE(以太网载光纤通道),外加可为每个节点提供2 x 80 Gbps网络传输能力的原生光纤通道体系。
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。