日前,在百度顺义数据中心,浪潮向百度交付了最新一批整机柜服务器,涉及节点超过1万台,交付过程为8小时,相当于每2.88秒1台服务器,刷新了业界服务器交付最高速度。以此计算,浪潮整机柜服务交付能力已经达到30000节点/日。
百度顺义数据中心2018年建成使用,可容纳数十万台服务器,核心承载百度云、AI等发展最快的新兴业务。以百度云为例,2018年用户数和合作伙伴数增长 3 倍,流量增长5 倍,收入则增长了4倍。互联网公司的业务不仅成长快,而且具有很大的不可预测性,常常会出现超出预料的超高访问量,所以互联网公司,尤其是TIE1互联网公司都在大力提高各自的基础架构快速弹性扩展能力,一方面采用云计算等技术手段,另一方面改进流程,强化数据中心供应链,提高服务器等数据中心设备的部署效率。
浪潮是百度核心的计算方案提供商,双方能够不断创造服务器部署最快速度,是多年来在技术、业务链等多个领域持续创新的结果。在技术层面,双方在2012年开始共同研制整机柜服务器,来替代传统的机架式服务器,将交付最小单元从单台服务器提到配置10-40个节点的整机柜服务器。
与此同时改变传统服务器的交付模式,据悉浪潮对百度数据中心的交付模式已提高到L11级别,交付效率最大提高到20倍以上。而且整机柜服务器的组装、调试、强弱电布线等现场部署工序前移到工程流水线完成,进一步简化现场交付的技术复杂度。
快速交付能力依托浪潮敏捷高效的供应链创新管理,而不仅是技术创新,生产、运输、质保等各个业务环节都在不断创新改造,例如整机柜服务器需要整体运输,高度2.1米、最大重量1.2吨,在运输过程中容易产生形变,造成质量问题,浪潮为此整合物联网、移动互联等技术开发路谱测试方案,对每条货运线路进行提前测试,并且在每台产品上配置智能终端,能够对运输途中的情况进行实时记录监测。
经过多年的改造重构,浪潮已经建立敏捷供应链系统,尤其是智能生产基地的投产,在业内第一个实现服务器的大规模定制化生产,有效缩短订单交付周期。浪潮智能生产基地统一整合了柔性生产、智能技术和物联网技术,整个工厂采用了600多个RFID、2000多个传感器、50个设备控制器以及330多套智能设备,部署了ERP、MES、WMS等6大智能信息系统。目前,大多数订单浪潮都可以做到“OTD≤ 7”(Order to Delivery),就是在收到订单后7天现场交付,大型订单不超过14天,此次百度的订单交付周期为11天。
作为业务链“最后一公里”,浪潮的现场交付能力也在不断提高。浪潮已经具有专业的交付工程师团队、标准化实施交付流程、配套自动化工具以及可视化实施过程管理系统,能够实现现场全流程流水化交付。此次百度交付,一台整机柜交付耗时不超过2分钟。
互联网公司的需求非常复杂,不仅追求效率上的“快”,更强调在应用个性化满足的无缝对接和快速实现上,这种需求源于不同的互联网公司业务的高度差异化。进行产品技术创新以及业务链敏捷化改造,正是浪潮业务模式创新的核心,在服务互联网用户的过程中,浪潮步步探索适合智慧计算时代的运营模式,形成了独特的JDM (Joint Design Manufacture)模式,JDM是以厂商与用户业务链融合为基础的敏捷商业模式,浪潮和用户的合作贯穿产品全生命周期,实现从需求端、研发端、采购端、品控端、生产端、交付和服务端的全面对接。在这种模式下,浪潮不仅可以实现已有产品的快速交付,更可以实现从需求确立、研发、生产,一直到服务等全流程、对接客户个性需求的快速交付。
目前,浪潮服务器一款新品的研发周期从1.5年压缩到9个月,客户提出需求最快可以3个月交付样机。而且,浪潮更深入的参与到用户的业务中,可以更好地把握用户需求,提高供应链管理效率,例如2018年浪潮联合百度供应链建立滚动预测机制,实现供需平衡运营管理,整体到货周期的大幅缩短。
目前,浪潮是全球三大服务器供应商之一,增速全球最快。互联网是全球服务器市场增长的主要动力,浪潮JDM模式获得了互联网公司的普遍认可,全球TOP10互联网公司中有5家大规模采购浪潮服务器,尤其在中国市场,浪潮连续多年保持市场份额第一,IDC显示,2018年Q3,浪潮在中国互联网行业的份额为47.8%,远远领先于其他厂商。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。