既然AMD愿意甚至说迫切希望斥资49亿美元收购一家系统厂商(这一数字比其2024年数据中心GPU的全年预期销售总额还要高),那自然意味着这买交易对其非常重要。对ZT Systems的交易就是如此。作为一家高性能系统的卓越制造商,ZT Systems总部位于新泽西州老牌数据中心小镇西考卡斯。
要到达西考卡斯,我们需要从纽约市穿过哈德逊河,之后涉过梅多兰兹的大片沼泽区域。多年来这里发生过不少故事,既有巨人队和喷气机队共用的体育场馆,也有传闻称身陷争议的美国劳工领袖吉米·霍法就在这里遇害。美国开国元勋亚伦·伯尔和亚历山大·汉密尔顿还在这里完成了堪称历史上最具政治份量的枪械决斗。
除此之外,西考卡斯还坐落着不少广播电视发射塔和演播室。凭借与华尔街之间的距离优势,这里很快成为1990年代高频数据中心的热门选址。最终,纽约证券交易所和纳斯达克也将数据中心迁入到这里,理由是西考卡斯的电价和地价都比曼哈顿便宜。Equinix、CyrusOne、QTS、Centersquare等其他公司也纷纷效仿,开始在离纽约市很近的地方建造数据中心。这些数据中心意义重大,但同时又远离纽约市主城区,不太会受到自然和非自然灾害的影响,因此更加安全稳定。
1994年,随着高频交易执法在新泽西的这版沼泽附近悄然兴起,ZT Systems正在制造个人电脑和SMB服务器,业务表现相当不错。但到2004年,该公司决定转型为金融服务企业提供高频交易和其他金融科技客户所必需的高性能服务器。2010年,ZT Systems开始提供机架式基础设施,并于2013年赢得首批超大规模基础设施运营商及云服务商客户。现如今,ZT Systems在西考卡斯、得克萨斯州矫治敦(位于州首府奥斯汀郊外)和荷兰阿尔梅洛(阿姆斯特丹以东)设有制造工厂,每年出货数十万台服务器、创造了上百亿美元收入。没错,这个数字背后可对应着一大批GPU服务器。
也就是说,ZT Systems可能是最默默无闻的大规模服务器制造商。虽然该公司也曾拥有不少金融科技客户,而且时至今日仍在向他们销售产品,但其绝大部分收入(具体来讲,是其99%的收入)都来自ZT Systems多年间与十几家超大规模基础设施运营商和云服务商之间的稳定业务往来。
在AMD完成对该公司的收购之后,ZT Systems创始人兼首席执行官Frank Zhang将继续经营制造业务并履行公司对现有客户的承诺。这项收购预计将于明年年初正式完成。与此同时,Zhang还将寻求机会将制造业务转手卖出。这部分业务目前拥有约1500名员工,AMD对这块服务器制造和销售业务并不感兴趣,理由是不想跟自己的客户直接竞争。这与我们熟知的另外一家知名GPU系统制造商完全不同……
此外,AMD还曾经与微服务器创新厂商SeaMicro有过合作。2012年3月,AMD时任CEO Rory Read出手以3.34亿美元收购了SeaMicro,而当时苏姿丰已经从IBM Microelectronics部门跳槽到AMD,负责领导其全球业务部门。2015年4月,AMD关闭了SeaMicro,但在苏姿丰出任总裁兼CEO之后AMD又重启了服务器业务。
AMD数据中心业务总经理、前戴尔定制服务器业务负责人Forest Norrod在采访中解释称,“很明显,我们已经开始与所有OEM和ODM合作伙伴进行谈判。而令人欣慰的是,所有这些对话都很好、态势积极。人们立刻就明白了我们这样做的意图,也欣赏、理解并且相信我们无意与客户直接竞争。AMD不想这样做,也不会这样做。我非常了解这两块业务,也对公司的决定很有信心。”
AMD的当务之急就是提高其系统架构和工程水平。据Norrod估计,目前AMD公司约有500名系统工程师,而ZT Systems这边则有1100名员工从事相关工作。考虑到AMD的系统构建流程不是要遵循一种、而是多种标准,因此需要有更多人来帮助设计并构建未来的GPU加速系统,以便对其开展测试(而非用于制造生产),期间的难度可想而知。目前尚不清楚AMD在剥离ZT Systems制造业务之后能“回多少血”,但要想聚集到这1100名拥有丰富实践经验的系统工程师,可绝非花上几十亿美元就能轻松实现的。除了收购ZT Systems这样的精品高性能系统制造商之外,几乎没有其他办法能够达成这一目标。
这个价码明显比收购Supermicro更便宜……而且双方的系统工程师很可能水平相当。
以下是Norrod就此次交易做出的阐述和说明。我们则结合完整的报价,尝试解读AMD为ZT Systems砸下49亿美元的理由——这相当于每位系统工程师445万美元(当然,其中一部分将通过制造业务的拆分和出售来抵消)。Norrod如是说:
“我们一直在认真规划发展路线图,并意识到在系统设计领域保证性能和效率具备竞争力和市场主导地位是项极为复杂的任务。对于AI系统,每一位从业者都越来越感受到这波浪潮给设计这类具有特定功率水平、信号传输速率以及极高复杂程度的系统带来的巨大挑战。让它们保持正常运行且可以管理将非常困难。”
“这方面有一系列现实问题需要解决,而满足这些问题的要求早在芯片开发过程的早期就已经出现。我们熟悉其中的一些问题,因为它们跟开发超级计算机时的情况有一定重合。但着眼于AI系统的发展,大家就会发现其复杂度一直在迅速飙升,因此拥有足够数量的世界级系统设计工程师将成为决定芯片开发在设计阶段就能顺利推进的关键性前提和必要因素。所以答案已经很明确,我们必须大幅提升自身的工程技术水平。”
“而让情况变得更为复杂的是,随着我们水平的持续提升,我们还希望坚持AMD长期遵循的开放生态与尊重客户选择的传统——而不是以专有方式将成果封锁起来。也就是说我们需要更多的人手。毕竟如果想做一套专有系统、让世界上每个人都能用得上,通过它满足自己的需求,那么只要定下一套固定的模板就行,这对人手的要求还没那么高。而如果想要培养开放的生态系统并支持客户的选择和变化,那情况则会复杂得多,需要我们投入更多的系统工程师数量来保证产品的上市时间和高质量表现。”
所以总结来讲,AMD目前最关心的就是如何保证产品的上市时间,同时提高系统设计与工程水平。AMD公司在开发优质CPU和GPU产品方面做得非常出色,但AI时代提出的要求是组装一整套网络技术栈和系统板,再将它们全部安装在经过大规模测试和验证的机架级与集群级系统设计当中。也正因为如此,英伟达才会出手开发DGX系列产品。AMD当然理解这样做的意义,但仍然选择不会亲自为客户构建系统,也不会成为高性能计算(HPC)或者AI集群的主要承包商。这一点与英特尔不同——芯片巨头曾经想要在HPC和AI集群领域一试身手,但在失败后被迫退出。
Doug Huang曾经在Norrod领导下的戴尔数据中心解决方案部门担任过工程总监。2013年1月,随着ZT Systems开始向机架级系统转型,他也应聘担任平台工程副总裁。Huang随后又晋升为ZT Systems的工程与全球制造业务主管,并于2023年1月被任命为公司总裁。Huang将继续留在AMD,负责管理一支由约1600名系统设计师与工程师组成的联合技术团队。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。