2月17日,国家发改委等部门联合印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设国家算力枢纽节点,并规划10个国家数据中心集群。全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。UCloud优刻得上海青浦云计算中心、乌兰察布云计算中心分别位于全国一体化算力网络国家枢纽节点的长三角和内蒙古节点。UCloud优刻得将依托两大自建云计算中心,打造一批“东数西算”典型示范场景和应用,满足企业数字化高质量发展需求。受益于该政策拉动,UCloud优刻得有望迎来更大发展空间。
数字化时代,算力成为国民经济发展重要基础设施,根据工信部下属机构赛迪智库发布的《先进计算产业发展白皮书》,全社会对算力需求预计每年将以20%以上的速度快速增长。为满足日益增长的算力需求,“东数西算”鼓励将东部数据传输到西部进行计算和处理,特别对于后台加工、离线分析、存储备份等对网络要求不高的业务,可率先向西转移,在全国范围内调配资源,带动数据中心产业链快速发展。
遵循国家“东数西算”的发展策略,UCloud优刻得在构建自有云计算中心的选址布局上有着同样的战略规划。
UCloud优刻得乌兰察布云计算中心距北京300公里,整体规划用地面积约140000平方米,规划建设5栋数据中心,总计可容纳6000个8.8KW机柜。一期已投产,T3+级别,建筑面积23000平方米,机柜数量约为2500个,设计功率4.4-8.8kW,可根据用户对机房等级、系统架构、单机柜功率等使用需求量身定制。链路资源上配置双路入京线路,南北两路由时延在7.1ms/4.4ms之间,可提供高标准的SLA服务等级协议和网络可靠性保障。
在UCloud优刻得整体规划中,乌兰察布云计算中心位于内蒙古自治区算力网络国家枢纽节点的集宁大数据产业园。凭借地域优越,安全稳定、电价低廉、低温自然制冷等优势,更适用于对位置、网络延迟要求不高,对成本控制较为敏感,对扩容需求、数据计算、数据存储高需求的行业,与UCloud优刻得软件定义云计算中心的技术相结合,以冷数据存储、大数据离线计算、HPC(高性能计算)、AI训练四大场景解决方案,助力中大型企业在环京地区的业务部署上云,为企业降本增效,节省IT运营成本近50%。
上海青浦云计算中心是UCloud优刻得在一线城市自建的第一个大型数据中心,位于国际都市上海,地处中国骨干网集中交汇地之一,属核心资源区。总体建筑面积约5.54万平方米,UCloud优刻得将依据行业最高标准,在园区建设3栋新一代高效节能绿色数据中心,通过创新设计以及精细化运营,将PUE严格控制在1.3以下,打造长三角生态绿色一体化发展示范工程。该数据中心一期可容纳3000个机柜,预计投产时间为2022年。
上海青浦云计算中心位于长三角地区算力网络国家枢纽节点起步区。背靠长三角,将承载企业核心计算业务、高时效要求业务,为用户提供业务快速发展带来更高算力、更低延时的体验。建成以后将成为优刻得在华东地区的云计算核心基地,以大数据、人工智能、物联网、电子政务等为着力点,充分发挥云计算平台赋能优势,立足青浦、辐射长三角、服务全国。
UCloud优刻得在建设云计算中心过程中积极践行“双碳”目标,在全球云计算中心广泛使用绿色清洁能源和节能技术。乌兰察布云计算中心供电系统采用HVDC系统,组合高效变压器和高压直流,减少电力损耗,确保供电效率达98%以上;基地内的分布式控制照明系统,利用物联网技术、电力载波通讯技术、嵌入式计算机智能化信息处理等技术,比传统照明系统的电能利用率提高80%以上。
同时,乌兰察布云计算中心所在地气候凉爽,全年平均气温4.3℃,全年气温低于15℃的时长为6799小时,具备充足的自然冷却条件,以此为基础,UCloud优刻得在乌兰察布云计算中心采用制冷系统集成自然冷却模式,降低制冷系统能耗;并利用水源多联机回收机房余热,用于办公室、电池室、水泵间、柴发机房等的冬季采暖。乌兰察布云计算中心还提前部署耗水量极低的风冷式冷冻水系统,提高制冷效率,降低水资源损耗,成为乌兰察布限水政策出台后首批符合水资源使用标准的企业。
目前,某人工智能龙头企业、上海概率等东部科技企业,已率先将离线分析、存储等部分对时效要求不高的业务部署到算力成本更低的UCloud乌兰察布云计算中心。2022上半年,上海青浦云计算中心的投产将满足更多实时计算等业务的进行。
“东数西算”是一体化推进全国算力优化布局、加快推动8大算力枢纽集聚力和影响力的重要规划,为数字化产业合理布局基础设施,降本增效提供政策引导,同时也将推动数据中心产业迎来更大发展空间。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。