每年中国互联网行业有两次最难熬的“时刻”
一个是国庆之后的“双十一”
一个是春节期间的春运
作为世界上最大的短时间内人口迁徙运动,春运期间的网络抢票以及付款难度大家曾经有目共睹,12306网站的访问量就像天天过“双十一”。要知道,2018年春运,铁路售票总数4.48亿张,其中互联网售票量为3.48亿张。
12306官网
从技术难度上看,看似商品交易比购票复杂多了。可事实上,12306更为复杂,如果每秒有数以亿计的访客同时访问、查询、订票,以及退票,12306的后台需要万分之一秒甚至更快的反应速度,票务系统才能精准判断售票对象。近年来,日新月异的抢票软件极速访问与下单,更加剧了访问负担,然而12306却实现了越来越稳定且反馈越来越快,这简直是个奇迹!
数字经济时代,要做到这些,需要12306后端有庞大的服务器集群来提供支撑。这些服务器不仅要求系统稳定,快速部署,而且还能够非常“抗压”,这对于服务器集群敏捷的扩展性,维护管理的便捷性提出了新的要求,以保证资源平台的按需配置、弹性部署,更好的衔接硬件平台与售票业务。
因此,12306自从2012年推出以来饱受亿万国人关注,它也成为互联网行业界仰望的一座“高峰”。曾有媒体表示,12306在数据库访问、动态库存、负载均衡、运算量等一系列问题,曾让许多全球知名厂商望而却步。
这个时候,浪潮开始与12306深度合作,通过更互联网化的IT装备升级和优化12306的系统架构。
浪潮整机柜服务器SR
12306诞生6年以来,先后经历了多轮系统升级。其中,浪潮整机柜服务器SR多次被应用其中。作为计算领域的中国“明星”,浪潮SR整机柜服务器是超大规模数据中心基础架构的核心形态,同时还能实现可定制化服务。在同样规模、同样投资的情况下,通过SR的模块化部署、集中供电、集中管理,大幅度优化了空间利用率,相比传统机架服务器计算密度可以提升一倍以上;由于散热和供电部件的集中和精简,降低了数据中心的采购和运营成本;同时整机柜服务器SR以机柜为最小交付颗粒,交付效率相比传统服务器可提升8-10倍。
在最新一轮的改造中,12306的新一代客票平台系统、移动购票平台后台系统均采用了浪潮整机柜服务器SR。这些看似冰冷“黑乎乎”的服务器们,显著提升了12306的运算能力、服务支撑能力与可用性。12306随之进化成全球顶尖的实时交易系统,为整个春运带来了科技的“温情”。
如今,12306已经能够支撑每天超过400亿次的用户访问,为每年几十亿次的旅客出行需求提供高速稳定的网络售票服务。2018年春运期间,浪潮整机柜服务器SR保障12306顺利完成单日售票高峰1135.7万张,每秒查询峰值164.8万次,平均响应时间仅400毫秒。
而12306迄今实现的成果,被业界誉为引领了一场互联网领域的技术革命。
目前,浪潮SR整机柜服务器在整机柜市场占有率达60%,在百度、中国移动、阿里巴巴等企业的云数据中心实现大规模部署。全球10家市值最高的互联网公司中,迄今有5家在大批量采用浪潮的服务器和创新数据中心方案,并把浪潮作为核心供应商。与之对应,2017年,浪潮实现了全球服务器市场份额前三,蝉联中国第一,为建设数字中国、网络强国提供计算力支撑。
在加快迈向智慧未来的过程中
是否会有下一个新的变革出现
又将需要如何强大的计算力支撑
8月29日-30日
“云数赋能 智慧未来”Inspur World 2018
或将为你揭晓答案
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。