随着数字经济在整个国民经济当中占比以及重要度不断提升,特别是近几年像人工智能、物联网、5G等等一系列不断涌现的新应用,对算力和数据中心的需求日益增长。
日前,多部委联合印发的《全国一体化大数据中心协同创新体系算力枢纽实施方案》中指出,要坚持推动数据中心合理布局、供需平衡、绿色集约、互联互通,构建新型算力网络体系,促进数据要素流通应用。
作为新基建的重要数字基础设施,数据中心建设规模正不断扩大,一个不可回避的问题就是数据中心能耗总量的增长,以及能耗高、布局待优化等难题,要实现“全国一体化大数据中心”规划与建设目标,破局关键在“绿色、安全、服务”三大体系协同创新。
在此背景下,中科曙光发布“曙光生态级一体化大数据中心”方案。该中心围绕曙光绿色、安全、服务三大生态体系,通过前沿技术应用与创新,携手产业链伙伴,践行绿色集约、统筹规划等理念,助力实现数据中心绿色低碳、高质量发展。值得关注的,该方案是国内首个“生态级”一体化大数据中心方案。
“生态级”意味着该方案从能源供给端一直到数据中心的建设端、运营端,实现有机整合,覆盖数据中心全层级、全生命周期。
“在构建传统大型数据中心方面,曙光拥有液冷节能、高端计算、底层安全等领先技术与能力。但一体化大数据中心的建设目标,需要产业链协同才能实现,这也是我们发布生态级一体化大数据中心的初衷,曙光将开放更多的技术与能力,携手伙伴,推动产业生态创新。”中科曙光副总裁、曙光数创公司总经理何继盛说。
生态级产业协同破解“高能耗”难题
伴随“2030年碳达峰、2060实现碳中和”目标提出,能耗大户“数据中心”正迎来更加严苛的能耗标准。近日,北京等多地出台数据中心项目节能审查政策,进一步限定PUE值(评价数据中心能源效率指标)与数据中心规模。新政规定,北京市内新建、扩建数据中心若PUE值超1.4,将被征收差别电价电费。
何继盛表示,PUE是衡量数据中心能耗水平一个比较直接的指标。实现数据中心的节能与低碳目标,需依托曙光内部节能循环,以及联合产业伙伴构建外部低碳循环,双“循环”齐下才能达成。
内部节能循环方面,曙光自2011年便开启服务器节能液冷技术的探索与研究,如今曙光已拥有50多项“液冷”核心技术专利。
作为“曙光生态级一体化大数据中心”的节能技术底座,曙光相变液冷技术可助数据中心实现全地域、全年自然冷却,PUE值可降至1.04。若全国50%新建数据中心采用曙光相变液冷技术,每年可省450亿度电,减排3000万吨二氧化碳。
中科曙光除了在设备级能够做到模块化部署,在整个数据中心级也可以实现模块化的部署,打造更高密度的数据中心和更快的交付速度,比如我们熟知的硅立方数据中心。
外部低碳循环层面,曙光携手产业伙伴,通过风电、水电、光伏等清洁能源的高效利用;数据中心余热回收;节能、节地、环保的绿色建筑设计等,可进一步大幅降低数据中心碳排放总量,从能源供给端实现零碳的能源供给。
“在每一个生态合作层面下,曙光可以发挥自身的技术和能力特点,同时,又能跟合作伙伴联合实现优势互补。”何继盛说。
助力实现数据中心一体化布局
除绿色、节能外,安全性与建设运营体系创新,也是行业构建全国一体化大数据中心过程中重点关注领域。
何继盛表示,传统数据中心建设考虑更多的是数据中心本体的建设,依托于某一个企业自身的技术、方案、产品。随着一体化数据中心政策的指引,我们看到国家是希望从能源供给端一直到数据中心未来的运营管理实现通盘统筹的考虑。
在安全生态领域,曙光携手合作伙伴,一同构建安全基础设施,并实现从建设到管理运维的全栈安全技术体系部署。在技术安全层面,曙光实现从全国产硬件基础设施到云平台、数据平台的整体安全。在运营安全层面,曙光实现了安全运维、安全管理、安全运营、安全合规四架马车并驾齐驱,是最早通过“中央网信办云服务网络安全审查”等诸多核心资质审查的服务商。
在服务生态领域,在计算与数据服务方面,曙光拥有丰富的计算服务、城市云服务、大数据服务经验积累,累计服务超10000家政企用户。通过“算力、算法、数据”融合,曙光计算服务可支撑科研领域、工业领域、人工智能领域多样应用,并实现跨区域算力资源调度,助力实现数据中心一体化布局。建设与运营服务层面,曙光携手产业伙伴,实现数据中心从顶层规划到建设实施、运维管理的一站式服务。
“相信曙光生态级一体化大数据中心的发布,能更好助力全国一体化大数据中心建设。”何继盛表示曙光作为率先实践液冷节能技术、以及拥有安全和服务全体系能力企业,将携手更多产业伙伴,推动数据中心行业实现绿色高质量发展,提升能源利用率,降低能源消耗,助 “双碳”战略早日达成。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。