科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道虚拟化/云计算微软秘密曝光!Autopilot是隐藏云武器

微软秘密曝光!Autopilot是隐藏云武器

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

作为微软首席执行官,萨蒂亚•纳德拉可能还是位初来乍到的新人,但他对于该公司的关键性内部工具以及与Amazon及谷歌开展竞争的方案早已非常熟稔:这正是名为Autopilot的一款复杂度极高的软件系统。

来源:ZDNetserver频道 2014年2月10日

关键字: 微软 Autopilot 服务器

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共2页)

ZDNet至顶网服务器频道 02月10日 编译:作为微软首席执行官,萨蒂亚·纳德拉可能还是位初来乍到的新人,但他对于该公司的关键性内部工具以及与Amazon及谷歌开展竞争的方案早已非常熟稔:这正是名为Autopilot的一款复杂度极高的软件系统。

Autopilot是一款帮助微软将数百万台服务器以及上万PB海量数据融合成一整套庞大强劲计算及存储资源池的工具。如果没有Autopilot,纳德拉之前所领导的服务器与工具、在线服务、搜索与广告乃至云与企业部门都将变得一塌糊涂、完全没有可靠性可言。

谈到使用Autopilot的感受,Windows Azure业务总经理Mike Neil在接受我们采访时表示,就像手握着“一辆价值数十亿美元的超级豪车的钥匙。”

微软很少在公开场合谈论Autopilot,而且迄今为止也只在两份官方文件中谈到过这款工具:一份发布于2007年、如今早已过时的文章,题为《Autopilot:自动化数据中心管理》;另一个则是2013年发布的网页,其中解释了Autopilot的开发团队如何凭借在这套系统研发工作中的不懈努力赢得“杰出技术成就”奖。

Autopilot之所以一直保持笼罩着神秘的面纱,部分原因在于直到现在、微软营销部门仍宣称它用于运行云环境的全部组件都能为公众所直接购买。

对于熟悉分布式系统的行家们来说,大型IT设施的特殊性质以及复杂的相关要求绝不是轻易就能搞定的,因此微软的这种说辞始终难以令人信服。不过如今我们终于揭开了正确答案:没错,微软确实在内部使用了大量自有商用软件来运行云环境,但“绝大多数”运行在微软数据中心内的应用程序最终都要以Autopilot系统为基础。

Autopilot软件现在已经彻底实现了整个服务器运行周期的自动化目标,从启动、操作系统安装到故障检测与修复,再到反复启动与供应商不良产品退返,”微软方面解释道,Autopilot技术小组已经可以顺利谢幕,因为他们打造的方案正通过悄无声息的运转给微软在互联网规模服务的转型带来深远影响与有力支持。”

它同时也有助于为应用程序分配资源、在作业运行时设定进程规划、从数百万台计算设备中收集信息并在最多一分钟之内给出经过优化的可利用信息,而且也成为了其它更为神秘的先进技术的组成部分——例如艾字节级别COSMOS数据分析引擎,我们所熟知的BingXbox Live以及Windows Azure都建立在这套引擎的基础之上。

最后,Autopilot已经与经过重新设计的微软数据中心硬件紧密契合在一起,这标志着微软已经不再从传统供应商手中购买高端设备、转而自行设计商用型廉价服务器——这些计算设备的构成方式已经随着今年一月微软加入Facebook开放计算项目而公诸天下。

换句话来说,如果微软的服务器是提线木偶,那么Autopilot就是幕后那只看不见的操纵之手以及构建木偶表演舞台的关键性角色。

NeilAutopilot比作了波音747客机:“它庞大、复杂而且轰隆作响”。根据他的解释,这套系统的设计目的在于“将工作负载从飞行员(也就是数据中心系统管理员)肩上卸下来,从而让这些优秀人才能把精力集中在其它更重要的事情身上。”

Autopilot的关键性任务之一就是处理底层基础设施的配置工作。

当微软希望为其遍布全球的“十到一百”家数据中心添加容量资源时,他们通常会在一个集装箱里塞进约上万个计算节点——用微软方面的说法这叫作“ITPAC”。一旦这些设备与数据中心的电网接驳完毕,Autopilot就开始检查所有新服务器是否经过正确配置、相关网络是否工作良好,同时帮助将它们与系统中的其它部分进行对接。

Autopilot不仅为主机部署并管理操作系统镜像,同时也负责管理已经部署完成的应用程序,”Neil解释称,“这套代理机制与操作系统镜像如影随行,而且也是我们SDN解决方案的组成部分。SDN解决方案同时管理着东西与南北流量,我们的拓朴结构则带来了相当充裕的网络带宽以及路径冗余。”

就算这些服务器已经被纳入微软遍布全球的“超过百万台服务器”网络,Autopilot仍然能够出力辅助对其进行管理。

如果某台服务器发生故障,Autopilot所具备的“自我修复”功能可以预防集群规模下的批量瘫痪,他指出,“设备故障状况时有发生——Autopilot能够采取整治行动,从而帮我们解决这些疑难杂症。这套系统拥有大量自动修复操作规程,我们根本不用操心那些没啥技术含量的鸡毛小事。”

Autopilot还拥有一套极为精巧的调度组件,再用航空领域的例子来打比方,它能像空中交通管制员那样打理微软全球计算设备池内不计其数、大大小小的各类工作负载。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章