图一、谷歌在互联网上公开展示的数据中心实景图
看到这幅图,即使不瞧图注,你可能也会猜到这是谷歌公布的自家数据中心实景照,类似的美图几年前就曾风靡于网络,不少人都感叹这样的数据中心已经超脱了技术的范畴,更像是精美的“艺术品”。其实很多大型IT和互联网公司都具备类似的、条件较好的数据中心,它们在规模、环境、设计等方面都是各有所长。
图二、条件与数据中心截然不同的边缘机房环境
不过大部分的数据中心,可不一定有这样的条件,尤其是数以千计的电信运营商的边缘机房,条件和环境可以形容为“有限”,甚至“恶劣”,在很多方面无法满足那些住惯了“五星级酒店”甚至是“豪华套房”的常规通用服务器的部署及运行要求,例如:
· 机架空间受限。传输及接入机房机架多为600mm深,少部分达到800mm,远小于数据中心1200mm的机架深度,常规通用服务器无法部署;
· 环境温度稳定性不佳。由于边缘机房的制冷系统的稳定性无法得到有效保证,在制冷系统故障时,机房温度可能会达到45℃以上,因此服务器需要具备电信设备的温度适应能力;
· 机房承重受限。众多边缘机房普遍低于数据中心承重标准,对服务器的部署密度造成影响。
此外,在服务器的技术需求方面,包括性能需求、时钟与同步精度要求、异构计算要求等,以及运维管理需求等在边缘机房也面临诸多新需求与挑战。
而随着电信运营商网络转型与重构的快速推进,打造一个适应网络转型、满足未来电信应用需求,特别是5G时代应用需求的服务器硬件平台就尤为格外重要,而且这个平台也一定要兼顾到上述边缘机房带来的所有挑战。
图三、OTII定制服务器参考设计和行动计划书联合发布现场
为此,在6月28日的MWCS现场,中国移动与中国电信、中国联通、英特尔、华为、浪潮、Mellanox、云达科技等公司共同发布了《OTII定制服务器参考设计和行动计划书》,并正式宣布推出首款OTII服务器原型设计方案。
OTII项目结合运营商业务需求和眼下的挑战,联合行业合作伙伴进行了一系列前期调研分析,并在英特尔提供的主板参考设计等支持下确定了初步的技术方案。技术方案在配置规格及关键组件,物理形态、供电及环境适应性,BIOS、BMC及硬件管理三方面进行了面向电信应用的深度定制服务器设计。
图四、搭配英特尔至强D处理器的OTII边缘服务器原型机
现已推出的OTII定制服务器参考设计原型机总体上反映了OTII在配置规格、硬件设计和管理维护等方面的技术要求:470mm (D) x 434mm (W) x 87mm (H)的机箱尺寸,更适应边缘机房的空间、供电条件,并能满足高达45摄氏度的恶劣边缘环境要求。在配置方面也具备较强的可扩展性,以单路设计为例,原型机可配备英特尔至强或至强D处理器,可支持最多集成18个内核的处理器,可配512GB内存,具备8个2.5英寸存储盘位,并预留3个PCIe插槽,来满足在扩展方面的需求。
该原型机目前已经初步具备运行能力,后续将在此基础上,进一步完善和验证软硬件兼容能力、硬件管理能力等,并将结合实际的5G、MEC、O-RAN等业务测试,进一步明确后续的配置规格和部件选型要求。
当前,国内三大电信运营商在5G、MEC和NFV等应用已经在开展试点,取得了不少成果与进步,当然,也需要在更多问题和环节上进行攻关突破。为此,OTII项目联合产业界制定了未来行动计划,预计到2020年实现OTII服务器规模应用,以支撑5G业务的发展。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。