至顶网服务器频道 08月07日 新闻消息(文/邹大斌): 近年来,在云计算、大数据、物联网等技术和应用的推动下,数据中心市场出现了蓬勃向上的发展势头,在各地出现了不少大型和超大型数据中心,10万台、50万台服务器的数据中心越来越常见。与此同时,政府部门也开始进一步对数据中心市场进行规范,北京在前几年就已经出台政策规定,新建数据中心PUE值不得超过1.5。
那么,数据中心市场未来会有哪些发展?这到底是红海市场还是蓝海市场?还有哪些技术会影响数据中心的市场走势?北京供销大数据集团作为大数据“国家队”的一员,现在在北上广等多地拥有多个数据中心产业园,对于该产业的冷暖自然有着更为切身的体会。
数据中心市场未来仍然是一个成长中的市场,因为背后的需求一直在不断增长。比如,思科就曾预测,2021年全球连接设备将达271亿台,物联网设备将达137亿台。这么多设备所产生的信息存储、传输、处理必然需要数据中心的支撑。
赛迪顾问曾对中国整个数据中心市场规模有一个统计:2013年中国数据中心租赁市场大概是290亿人民币规模,到2017年达到了930亿,将近千亿级别。2018年的统计和预测,将达到1240亿的规模,2019年预测会达到1600亿以上。
“在中国,数据中心的市场和全球互联网发展趋势完全一致,也是在一个快速上扬和上涨的趋势,而且增速非常明显,平均增幅维持在30%左右。正是基于大的趋势,北京市供销合作社做出了一个战略决策,要抓住互联网时代的发展机遇,建设大数据产业的国家队。”北京供销大数据集团数据中心业务相关负责人表示。
此外,集团负责人还列举了一些传统企业进军大数据产业的并购消息:光环新网以29.09亿元人民币收购中金云网北京数据中心的全部资产;纺织企业蓝鼎控股用15亿元人民币收购了高升科技;沙钢股份29.08亿元收购德利讯达等等。从这些案例就可以看出来,很多传统企业在往数据中心的行业里渗透。这背后的原因在于,国家有产业导向和政策引导,同时,传统行业也有转型、发展的需求,两者共同促使这些场外的企业纷纷进入数据中心市场。
在这样的市场背景下,北京市供销合作总社抓住互联网时代的发展机遇,建设大数据产业的“国家队”。作为北京市供销合作总社的下属单位,北京供销大数据集团致力于打造一流的大数据技术,建立一站式的高品质服务体系,建设覆盖全国一体化的国家级大数据中心集群。
目前,北京供销大数据集团在各地按照“3+10+X”来布局数据中心的建设。所谓“3”就是指在北上广三个重点城市打造大型的数据中心园区。相关数据显示,国内40%以上的数据中心需求来自这三个地区,因此,第一梯队选择北上广也在情理之中。
“10”是指包含武汉、成都、贵阳、南京、重庆等十个工信部确认的互联网骨干结点城市,这些城市对于数据中心的需求也更为集中。
“X”指的是除了前面13个城市之外,其他对于大数据发展有重要支持的新兴城市或者新兴地区,这些城市地区可能会以比较优厚的土地价格包括溢价、比较优厚的政府配套条件以及政府配套政策去支持大数据产业在当地的落地。这些城市构成北京供销大数据集团数据中心落地的第三个梯队。
除了“3+10+X”之外,北京供销大数据集团在今年年初还提出了“百城计划”,将数据中心布局点从“3+10+X”中13个城市拓展到将近100个城市,覆盖了中国四分之三经济发达地区。
在这些地方北京供销大数据集团除了建立传统的数据中心之外,也会向数据中心周边的产业拓展。比如,“百城计划”就包含两个内涵:一个是在这些城市内打造数据中心的中小型园区;另一个是搭建专线网络。 将一个线和城市作为一个点,最终组成一个百城的网络,最终打造出一个云网一体的服务体系。
与“百城计划”相关,北京供销大数据集团还有一个“城市芯片”的概念,即把和数据中心相关、和大数据相关的周边产业集中到整体布局当中去。比如,会建一些大数据展示中心,包括大数据的孵化器等,通过这种模式实现落地城市大数据产业的升级。与“3+10+X”和“百城计划”主要面向一二线城市不同,“城市芯片”主要面向三、四线城市。
据悉,现在“3+10+X”、“百城计划”以及“城市芯片”都在稳步推进之中,截至目前,北京供销大数据集团在承德(德鸣项目)和贵阳(乾鸣项目)已经各自建成一个数据中心园区,在北京也有自己的数据中心。除了自建的数据中心以外,北京供销大数据集团也有一些租赁的数据中心,以满足用户更多样化的需求。而在具体业务方面,主要是数据中心机房的租赁和CDN服务。顺便提一句,在北京供销大数据集团成立初期,就自己打造了一个具有自主知识产权的CDN平台,并获得了工信部相关的牌照认证。
如前所述,数据中心市场是一个长期看好的市场,但不可否认,市场竞争也不可谓不激烈,有人认为这已经是一个红海市场。在激烈的市场竞争之下,如何打造自己的差异化优势则成为北京供销大数据集团必须思考和面对的问题。
“定制化的产权式数据中心”就是北京供销大数据集团在数据中心市场的差异化竞争策略之一。现在市场上的数据中心几乎都是先建设完再招商,这种模式注定数据中心的建设标准不是根据客户的需求订制的,而实际上不少客户(如大型跨国公司或者金融企业)对于自有数据中心的硬件要求应该非常严格,严格到具体使用的设备品牌和安全级别都有要求。因此,北京供销大数据集团提出了“定制化数据中心模式”。
北京供销大数据集团的数据中心建设会分成两个大的阶段:第一阶段,先会按照国标A级机房去设计整个机房的工艺流程,但它的建设不是一次性达成的,会先建设它的整个主体结构,但内部设备先不上;第二阶段,等确定了客户入住的意向之后,技术团队会跟对方的技术团队做一个二次对接,按照对方需求来做二次定制。
据悉,这种定制化模式优势在于,一是可以精准地满足企业的需求;同时,它可以极大地缩短大规模高标准数据中心的建设时间。另外,“产权式的数据中心”也有其独特优势,因为这意味着北京供销大数据集团的数据中心是可以实现单栋楼产权的切割交易的,这个模式也是传统工业地产所不具备的,甚至还可以支持“售后反租”模式,就是客户购买数据中心后北京供销大数据集团再租用。
“定制化和产权式形成了我们两个核心的竞争优势,也是和国内现有数据中心建设公司不一样的地方。”集团负责人表示。数据中心发展的趋势,尤其是高端数据中心的发展其实一定是会以定制化作为它的主导方向,这也是北京供销大数据集团区别于国内很多所谓低端的数据中心或者叫做传统数据中心的一个重要区别。
另外,北京供销大数据集团是一家数据中心运营服务商,有供销集团的国家队的身份,从IDC到CDN、到云的牌照一应俱全。同时,集团也有一只非常有经验的团队来运营,这不仅会给当地带来数据中心,会带来数据的落地,还会带来人才引入、高科技孵化,促进当地政府的招商引资。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。