AMD CIO谈承载公司复兴的数据中心行动

AMD首席信息官Jake Dominguez担任着芯片制造商最近多灾多难历史中越来越重要和充满焦虑的工作之一——可能远远超过高管层中的其他人。他在2011年9月加入AMD,然后在2012年11月被提升为公司自己IT部门的负责人,现在负责AMD检查整个公司的内部流程。

ZDNet至顶网服务器频道 04月21日 编译: AMD首席信息官Jake Dominguez担任着芯片制造商最近多灾多难历史中越来越重要和充满焦虑的工作之一——可能远远超过高管层中的其他人。他负责AMD检查整个公司的内部流程,希望使其在面对激烈竞争的时候更加灵活和积极,不仅仅是主要竞争对手英特尔,还有不断崛起的移动芯片制造商,包括三星、高通和美光。

总部位于加州桑尼维尔的AMD目前排在12家国际竞争对手的后面,其中5家是总部位于美国的芯片制造巨头。它的落后并不仅仅是因为英特尔推动的反竞争,导致欧盟发出14亿美元的罚款——英特尔提出上诉的处罚。AMD公司的落后,是因为它无法凭借最好的技术以健康的步伐从一众公司中脱颖而出。

AMD的问题并不是缺少新想法。相反,AMD自己的IT基础架构让它慢了下来。设计师和工程师们不能更快速地工作,因为ADM内部系统是缓慢且过时的,其成本已经飙升到无法持续更长时间的水平。

AMD CIO谈承载公司复兴的数据中心行动

说到Dominguez,他在2011年9月加入AMD,然后在2012年11月被提升为公司自己IT部门的负责人——正是AMD财务困境达到顶峰的时候。

ADM的工程和开发运营遍及全球各地的各个数据中心。AMD有一个向前冲的大胆计划,那就是将所有这些运营分支精简为两处,一处是佐治亚州亚特兰大,另一处是马兰西亚Cyberjaya。在缩减其服务器和把技术压缩到更紧密空间——足以实现比以前更高的虚拟化程度,同时节约功耗和运营成本——的过程中,该公司可以节约大量金钱,以准备推动来年的复苏。

“其中最大的客户抱怨就是我们是不可预测或者不可靠的,我们没有执行力。”Dominguez在电话采访中这样告诉ZDNet记者。他的工作首先是要开始“让我们内部井然有条”他说,“我们的IT系统是少数几个触及公司每个流程的机构之一。因此我们要稳定我们的整体环境运作,虚拟化和优化性能,现在这一点是通过我们如何执行来展示的。”

在2013年底的时候,AMD按时交付率已经飙升至92%,但是并未达到自己的预期水平。今年,这家芯片制造商的目标是95%。虽然3%的增长似乎看起来有些微不足道,但是可以节约成本并在每个财年创造数百万美元的利润。

Dominguez表示:“进入到这个财年,来自工程部门的需求是‘我们需要更多网格容量’——不管这意味着更多核心还是更多存储。我们已经证实的是,这些需求并不一定是真实的。”

他承认,数据中心整合和内部IT转变起初并不是一个受欢迎的举动,他通过指出目前存在太多低效率的问题来说明这么做的理由。

他说:“我们并没有在很多我们所需要的领域投资,所有我们有些跟不上趟。”

在经过数月寻找新服务器和应用,以及几十次“我们发现甚至更多”的跨机构上下的会议之后,Dominguez把这个项目比喻成进入车库并把东西扔出来,发现一些你以前都不知道它在那里、但又寻找了多年的东西。

ADM的数据中心整合是由一个指定的项目经理负责的,向Dominguez汇报,他负责这个项目,以他的经验非常清楚“由委员会管理”的传统模式是行不通的。Dominguez希望在这一点上由一个内部人士来引导流程,并能够在必要的时候向他寻求帮助。

现在随着该公司在经历了一年多利润下滑和两年运营收益下滑之后逐步开始复苏,它重返“黑色”状态并且运营成本逐步稳定,不仅是打破平衡。

但是整个过程并不完全一帆风顺。整合过程中一个更为关键的部分是将服务器机架和设备从美国德州奥斯丁物理地迁移到亚特兰大。从后勤方面看,这涉及到在安静的公众假期间用卡车把几吨重的机器在美国境内运送,而且在这期间要最大限度减少对员工的影响。

Dominguez解释说:“有两大部分的数据中心搬迁让我感到着急。一个是大型工程网络,我们必须在7月4日周末来搬迁,然后是SAP环境,我们必须迁移。如果这两个部分中的任何一个出了问题,都将改变整个数据搬迁的情况。”

他解释说,他们已经有很多年没有碰触或者迁移过这些数据中心资产了。之所有精神紧绷是有两个原因:如果在搬迁的过程中发生什么事情怎么办?如果在新大楼里服务器出现故障怎么办?如果在计划的搬迁中出现任何故障,那么整个公司的工作流程就要受到影响数天甚至是数周时间,导致公司损失数百万美元的收入。

他说:“让网络连接就绪花费了比我们设想的多一些的时间,我们在临近安装和搬迁SAP系统的时候切断网络,但是最终我们争取完成了。”

“令人惊讶的是,我们的目标是经过周末的搬迁在周一恢复系统启动,就像往常一样。”

Dominguez预计约有7天的停机时间,但是搬迁非常成功,在经过920英里的旅程之后系统在周一早上第一件事就是“按目标”恢复在线,这一天要比规划的提前了。他坦言:“如果我们在电网方面出现重大故障,那么它肯定就瘫痪了,我们也就失去了公司的新任,”从而迫使公司引入具有全新眼光的外部人士来做这件事。

到目前为止这次成功的数据中心整合是AMD历史上一次较为关键的点。Dominguez表示,从历史来看,AMD曾经有过故障和协调方面的努力,这次搬迁将帮助AMD向新的领域进发作为符合未来考验的战略。他说,重塑公司的IT战略将使其未来更加光明,向最新的技术突破迈进。

他说,目前公司的流失率处于历史低点,员工满意度不断上升,这些发生在公司前任首席信息官Mike Wolfe和其他高管在2011年离开公司之后。“我们必须重建组织并执行我们想要做的所有事情,”他解释说。

但是不要忘了,还有大量的工作要做,他这样说。“我现在主要担心的是,我知道我们的任务是什么,我们正在试图做什么,以及我们从哪开始着手——但是我们如何足够快速地实现这些?”

考虑到给他设定的时间表,以及他的部门必须达到月度和季度目标的执行节奏,这让他彻夜难眠。他说:“这的确是我们正在追寻的,让我着急的事,因为如果在这条路上有任何中断或者停滞的话,都会让你的速度慢下来。”

如果整个公司的生存前景落在了我的肩上,那这很可能让我彻夜难眠。

来源:ZDNetserver频道

0赞

好文章,需要你的鼓励

2014

04/21

10:15

分享

点赞

邮件订阅
白皮书