ZDNet至顶网服务器频道 07月02日:经过这些年的发展,数据中心已经不再是高高在上的,而是要更贴近用户。云计算和基于互联网内容的“爆炸”也推动我们转移到互联网的“边缘”,更靠近用户,当然如果只是进行一般的浏览,他很难注意到靠近还是远离边缘。
但是,对于某种类型的关键任务或实时浏览,例如视频、基于云的应用程序或者游戏,延迟性会限制降低性能,并提高安全风险,这就能理解为什么这些大型的互联网公司要在世界各地来建设数据中心,这些都可以称为是公司的边缘数据中心,这样可以确保本地用户访问可以直接访问边缘数据中心,提升访问速度和安全级别。所以,所谓的边缘数据中心是从地理位置上来讲的,和一个公司、企业或者机构的核心数据中心是分离的,但是可以和核心数据中心保持着时时的交互,对流量进行周期性的镜像,以便访问边缘数据中心得到的数据也基本是实时的。
那我们来看看边缘数据中心有哪些特点。首先,边缘数据中心要处理大部分的本地流量,向本地用户提供大部分的服务,这样可以减少核心带宽的流量,这个和数据中心内部的流量设计思想是一致的:在数据中心内部我们也是要访问流量尽量集中于一台网络设备下,减少访问外部的流量,这个可以节省出口带宽。边缘数据中心设计也是如此,这样直接访问,走的路径最短,还可以大大提升访问速度。
其次,和建设一个超级大型数据中心相比,建设多个边缘数据中心更加节约成本,而且访问效果更佳,这是因为一般互联网公司都处于核心城市,在这些地方建设数据中心投资巨大,而其它各地则要相对便宜得多,而且还可以得到地方政府的支持,在税收方面给予优惠。边缘数据中心的存在还减少了直接访问核心数据中心的流量,减少了租用运营商网络带宽的费用。再次,边缘数据中心可以提供更加丰富的媒体体验,只有当内容靠近用户时,才可能实现这一点。当我们打开一个网页都要等待几秒钟(访问核心数据中心要经过多级网络设备,由于每个节点的带宽都存在限制,访问速度会降低,累计的访问时间就容易达到秒级),这种体验感会很差,尤其是交互型的游戏在这种环境下就没有办法玩了。
最后,边缘数据中心有更好的安全性,边缘数据中心本身就为数据中心提供了第一层的防护,核心数据中心为第二层防护,这样形成远近高低不同的安全防护体系,而且接近用户的边缘数据中心可以很好地抵御DDOS攻击,对本地用户流量进行过滤,避免对其它数据中心造成影响,在边缘数据中心里部署安全防护,可以防止攻击影响到其它数据中心,攻击范围被大大缩小。
当然,边缘数据中心也会遇到不少的技术难题,这在一定程度上也阻碍了边缘数据中心的发展。首先,由于要尽量保证本地用户访问边缘数据中心能够实时,也就是需要将其它数据中心的流量实时镜像到本地,这样镜像的速度决定了需要占用的骨干网的带宽,数据中心需要源源不断地将核心数据中心要边缘数据中心搬移,反之也是,有些数据是需要在边缘数据中心和核心数据中心同时存在。其实我们在搜索网站上搜索一个关键词时,会发现搜索结果非常快,很快得到了几十万个搜索结果,实际上这个结果并不是很准确的,因为很多数据并不是实时的,还是边缘数据中心里保存的镜像流量,用户搜索行为也由边缘数据中心来直接响应了。
其次,边缘数据中心处于各地,日常维护主要靠远程方式,本地仅留守很少的技术人员,在边缘数据中心这边的技术力量是比较薄弱的,无法应对一些突发、紧急的问题,有时人员赶到边缘数据中心往往要数个小时,故障恢复时间会比较长。再次,当边缘数据中心发生故障时,可以将此边缘数据中心下的本地用户流量转移到其它数据中心或者核心数据中心,这样虽然可以恢复访问,但是速度和体验感都不会很好,而且这里不仅涉及到路由的切换,还需要数据的备份,应用系统的用户重建等一系列复杂的技术问题,搭建这样的备份切换系统需要设计很多环节,相比一个数据中心设计要复杂得多。现在跨数据中心访问的新技术:EVI、VXLAN等刚刚起步,应用还不多,边缘数据中心还有很长的路要走。
边缘数据中心是数据中心里最为重要的组成部分,虽然边缘意味着非核心,多有不受重视的含义,不过也有边缘效应的观点。正如生物学中关于边缘效应的定义:“当多个不同性质的生态系统交互作用时,由于某些生态因子或系统属性的差异和协合的作用而引起系统某些组分及行为的较大边缘”定义的这样,多个边缘数据中心的存在,往往可以给整个数据中心带来质的变化,这就是为何大型的数据中心要在各地疯狂建设数据中心的原因,只有边缘数据中心的数量上去,才能形成协同效应,提升整个数据中心的业务处理能力。
前几年到处都在说建设新一代的云数据中心,这个云高高在上并不是那么受人喜欢,所以最近又出现了雾计算,建设雾数据中心,建设云端数据中心等概念,这些概念更接地气,其目的就是要将数据中心边缘化,增加边缘数据中心的技术能力,设计更多适合边缘数据中心的技术。未来不仅需要建设一些超大规模的数据中心,不要一味地扩大数据中心的规模,也需要建设更多的边缘数据中心,也需要更多适合边缘数据中心的技术。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。