扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNet至顶网服务器频道 10月30日 新闻消息:IDC(互联网数据中心)是云计算的主要载体和最主要支点,IDC布局是否合理,规模化程度大小,不仅关系到云计算的持续发展,也影响着使用云计算服务的用户体验,更决定着云计算的成本是否合理。
传统的IDC布局,以网络为中心,造成IDC散、碎、小,阻碍大云时代的发展;采用IDC群的云基地模式,承载的服务器规模宏大,资源效率高,总体成本低,可以更高效地支撑云计算的发展与集约化。
当前IDC布局
存在的主要问题
传统的IDC布局多靠近基础电信运营商的网络核心或骨干节点,如腾讯、百度、阿里等的IDC绝大多数都部署在珠三角、长三角、京津等经济发达地区。尽管这些IDC同中国的互联网用户分布保持基本一致(中国的互联网用户70%分布在东部沿海经济发达地区),有效地支撑了中国互联网的发展,但也带来了各种各样的问题:
第一,可持续性存在隐忧。东部沿海等经济发达地区缺地、缺电,使得IDC布局四要素中的土地、电力两个要素成为很大的发展瓶颈。深圳已经限制超过10万台服务器的IDC的建设。今年夏天,华东地区经历了60多年来罕见的高温天气,杭州市供电局为了保民用,采用分区分时限电的策略,很多互联网公司在杭州的IDC也未能幸免。
第二,规模化程度不高。 根据云计算政策与发展论坛的统计,中国的数据中心超过5万个,但95%的数据中心服务器规模在500台以下。东部沿海等经济发达地区超过10万台服务器的IDC屈指可数。这给互联网及云计算应用的分布带来了极大的挑战,在造成应用部署碎片化的同时也使得IDC应用绿色节能技术的动力不足,能源效率低。此外,也导致IDC间的网络通信成本、运维成本高企。不久前,腾讯的微信服务出现了一次大面积的故障,时间持续4个多小时。故障的直接起因是上海两个IDC间的通信光缆被市政施工挖断,而其深层原因,除用户增长过快以外,异地的规模化灾备IDC尚未交付使用是重要原因。可见,规模化的IDC对于应用的合理分布、高效容灾是至关重要的。
第三,IDC与网络耦合过深。现在的大多数IDC不仅围绕着电信运营商的核心或骨干节点部署,而且大多寄生在电信运营商的省网或城域网里,流量路径没有单独规划,也没有单独保护。这个模式带来的问题是,随着IDC总量的增多,产生的流量占比越来越大,在从用户到IDC的复杂的网络路径上,难以避免各种各样的局部带宽瓶颈,网络路径上的任何故障,都会对IDC对外提供的服务产生极大的影响,使得IDC无法对最终用户提供除了物理时延影响之外的一致的网络服务。
移动化(Mobility)、云计算(Cloud Computing)、大数据(Big Data)的发展,意味着端上的应用会越来越多样化,规模会更大,而云中数据的规模与处理的复杂性也将再上几个数量级,传统以网络为中心的IDC布局已远远支撑不了云计算的持续发展,需要探索新的模式。
云计算高度依赖
基础电信运营商
互联网企业海量的用户规模,复杂多样的应用服务,背后需要几十万台IT设备的计算、存储、网络吞吐能力来支撑,需要全球数十个IDC,数万个机架,数百条的电路、光纤互联,以及数百个Internet接入、数T的带宽来协同才能实现。
以腾讯为例,目前的应用已经涵盖沟通、信息、商务、娱乐等方方面面,用户数量庞大。为了支撑这些业务的发展,确保用户体验,腾讯利用了基础电信的设施,从IDC到网络出口到互联线路来架构。腾讯的IDC布局经历了三个阶段,三种模型的变化:早期,在服务器规模不大,容量在万台左右的时候,IDC是散列部署的,没有规划,没有蓝图,基本上哪里有机房,哪里有机架,就把服务器放到哪里,主要驱动是快速找到IDC机架资源供给业务。随着业务规模的增长,业务突发的频次与规模也越来越大,散列部署越来越满足不了业务的需求,同时无序的IDC布局带来了运维支撑上的不匹配。于是演进到了新的布局模型——集中DC/AC部署,数据中心(DC)主要分布在三四个城市,负责平台型业务及核心数据存储的托管,而应用中心(AC)分布在十几个城市,以大带宽大流量的所谓“胖子业务”为主。集中DC/AC部署模型较好地解决了IDC资源规模快速突破十万台量级的问题,消除了单个城市在土地、电力、网络规模上存在的发展瓶颈问题,同时保持了平台型业务与“胖子业务”的平衡供给与分布。但是,随着IDC资源规模的进一步扩大,量级达到几十万台服务器,并向百万台演进的时候,这个模型开始暴露出新的问题:不同城市的IDC规模化程度不同,持续性不一致,应用服务发展所需要的IDC资源的配套扩展不同步,数十个城市IDC间的网络互联也越来越复杂, 应用的复杂耦合与IDC资源规模的扩大,需要有更高扩展能力的IDC布局来保证,包容应用间的复杂模块关系,弹性扩展。因此,多IDC群集的大型云基地模式便应运而生。
云基地布局应以能源为中心
IDC的布局主要应考虑四个要素:土地、电力、网络与人力资源。这四个要素,尤其是在不同规模条件下,对于IDC布局的制约却不是等同的。传统的IDC布局更多的是考虑网络的因素,要在靠近用户的地方部署,称之为云随光布。但是, Google、Facebook等国际互联网巨头大型IDC的布局目前已经基本上只考虑电力因素了,如Google IDC选址的标准就称为“Power,Power,Power!”
不同的IDC布局,其经济成本具有很大的差异。以一个100万台服务器规模的IDC为东部沿海地区用户提供云计算服务为例,其每年的用电约为30亿千瓦时。如选址东部沿海地区,从2000公里外输煤供电,单位成本约为0.142元人民币;高压电网(输电)供电,单位成本约为0.138元人民币;如选址煤炭资源丰富的西部地区,就地供电,并通过光网络将信息传送至东部地区(输信息),其单位成本约为0.015元人民币。
上述三种场景尚未考虑输电、输煤的损耗问题,就足以表明输送信息的成本是输电、输煤的十分之一左右,输煤不如输电,输电不如输信息。把IDC直接建设在能源丰富的区域,并通过光纤网络把IDC的计算结果传送到用户面前会有巨大的经济上的意义。实际上,一个100万台的IDC在东部地区一年的电费超过30亿元人民币,放在西部可能连10亿元都不到,而增加的光纤传输网络一年的成本一般不会超过1亿元。此外,西部地区的土地资源优势也为IDC的扩展提供了广阔的空间。
将IDC布局在西部地区,最为不利的因素是高技术的人力资源缺乏。这一问题可以通过采用模块化、标准化、工业化的IDC建设方式来弥补,以集中化的运维,简单标准的现场物理操作来应对,通过更多地利用自动化、智能化的技术来减少对现场人力资源的依赖。
IDC布局另一个需要考量的要素是网络。只有优化的网络才能更好地支持云基地向西发展的趋势。
云基地的发展
需要网络的更好支持
云基地部署在能源丰富的西部地区有巨大的经济意义,网络不应成为阻碍,更应该大力支持、推动这种趋势的演进。
云基地部署在远离用户聚集的地区,会增加IDC的服务器到用户端的时延,2000公里的距离增加的网络时延在12ms左右。如果是个稳定的网络时延,对于大多数的互联网应用如即时通信、游戏娱乐、信息获取、电子商务等都是可以忽略不计的,少数的应用如视频、语音等可以通过在用户就近部署静态、动态的CDN加速点来解决。根据腾讯的统计,通过Internet,IDC服务器到用户端的平均网络时延在50ms~90ms间波动,新增一个12ms的稳定时延,基本上不影响用户的体验。
考虑到容灾分布,需要有多个云基地。多个云基地间需要有大带宽的专网互联保证。云计算的通信模式表明,服务器间的通信流量(东西向)远远大于服务器到用户端的流量(南北向)。我们看到Google的IDC间通信带宽已达10T,而微软在全美新建的几个大IDC间的光纤环网,单方向起步也是2T,一个100万台服务器的IDC对用户服务的流量超过10T,跟另一个云基地间的同步、互联流量可超过20T。因此,大型云基地间需要保证数T的带宽,并可以T级为单位,线性扩容增长。
此外,云服务的特点决定了云基地提供的服务必须具备能够扁平化地触达到任何一个互联网用户的能力,因此,除了物理距离上带来的网络时延外,不应该有其他的差异。这就需要云基地与骨干网间有独立的路径规划与流量规划支撑,或者采用单独的网络平面,以确保整个流量路径持续得到保障。以上这些都给网络建设提出了新的要求。
总之,我们应该看到,云基地的出现与发展,可以使云计算更集约化,有利于从机架、带宽到电力等资源的高效利用,有利于行业上从业务模式到应用服务的高效互联互通,对于整个云计算行业的发展将是一个坚实的支撑和推动。在这一过程中,基础电信运营商的作用是十分关键的。目前,电信运营商在西部地区建立云基地的尝试,对我国云计算发展模式的转变具有重要促进作用,是值得充分肯定的。希望我国信息产业界能够共同努力进一步推动云基地模式在我国的发展。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者