ZDNet至顶网服务器频道 08月12日 编译:AMD公司今天在加利福尼亚州库比蒂诺召开的Hot Chips大会上披露了更多与其“西雅图”64位ARM架构处理器相关的信息。
只需对这块全新皓龙A1100系列系统芯片瞄上一眼,大家就会意识到这绝对是一款面向服务器的设备,而非针对手持硬件及嵌入式计算等ARM传统强项的产品,不过其未来在移动环境下亮相也并非不可能,AMD公司CEO Rory Read曾于今年四月作出过此类保证。
与预期相符,西雅图芯片拥有八个Cortex-A57计算核心——即ARM的顶级设计方案,运行64位ARMv8-A代码——并将利用28纳米制程技术进行制造。这些核心将运行在2GHz或者更高主频之下。
八核心西雅图系统芯片将配备4MB二级缓存与8MB三级缓存;双64位DDR3/4通道并具备ECC(即错误检查与纠正技术)机制,每条通道包含两套最高1866MHz的DIMM、单芯片最高支持128GB内存容量;控制器可支持八个6 Gbps SATA3端口、两个10Gbit以太网端口以及八条第三代PCIe通道。
西雅图还利用ARM的系统内存管理单元(简称SMMU)将之前提到的各类接口与其A57核心相对接。SMMU当中的S(系统)其实应该代表Super(超级)或者Steroids(兴奋剂)之意,这是因为SMMU的作用远远不止通常的地址转换或者访问保护那么简单:它允许虚拟机管理程序定义每一套访问系统转换表,并保持访客始终处于独立的物理内存池当中。SMMU设计方案已经出现数年之久,但其在虚拟化领域的应用仍主要集中在服务器级系统芯片层面。
而且如果大家对自己的当前系统芯片仍然满意,ARM也拿出了足以令人动心的设计——在系统芯片中加入另一套系统芯片:在一套系统控制处理器(简称SCP)当中包含一个配备64KB ROM与512KB SRAM的小型Cortex-A5核心;常用SPI、UART与I2C接口;TrustZone执行空间以及一个1Gbps以太网远程管理端口(RGMII)。
SCP的设计用途在于维护自身(在理论上)安全空间并执行代码的同时,启动、配置并监控主处理器。如果运行在主处理器上的系统发生故障,或者出现其它需要冷启动的状况,SCP能够及时接手设备的处理任务并借此避免停机事故。SCP的TrustZone组件能够确保系统始终以已知良好且安全的状态实现启动,这也成为系统可用性保障中的重要组成部分。
西雅图并不是惟一一款配备搭档CPU保持顺利运作的系统芯片——这类设计还有很多——但这种理念仍然值得称道。
计算机当中又有计算机……西雅图芯片当中实际包含两套系统、只不过有一套被隐藏了起来。
SCP采用UEFI 2.4,就是说在设备开启之后、该机制会首先对主系统芯片进行初始化,启用其自有实时操作系统,而后将其余任务交由A57启动核心处理、从而加载UEFI ARM固件。
虚拟机管理程序运行在我们的操作系统之下、又有操作系统运行在虚拟机管理程序之下……上图为西雅图处理器如何利用SCP完成启动。
其搭档处理器当中还包含一个专门用于密码算法加速的协处理器,其与SCP相对接或者通过内联机制接入SMMU。该协处理器提供一个随机数字生成器,而且能够与AES、Elliptic Curve Cryptography、RSA以及SHA等算法共同在硬件中实现zlib压缩与解压。
为什么用ARMv8-A取代x86-64?
说到这里,大家可能会提出质疑,为什么要采用ARM兼容CPU充当数据中心的处理中枢?ARM架构目前已经在服务器领域有所建树——最典型的例子就是将其嵌入至磁盘驱动器的控制器当中。但目前该架构的最大优势仍然源自低功耗与低复杂性,因此更适合依靠电池驱动的计算环境。是什么因素推动其一路向纯计算领域前进?这个问题确实让很多朋友捉摸不透。
ARM明显需要尽快迎接64位时代并借此跨入服务器领域:它已经向软件敞开了64位虚拟地址之门,并为来自英国的核心设计师们提供了一套与MIPS64相近的全新精简化指令集。ARM还利用物理内存优势扩大了可用空间,从而将该架构由40位物理地址(最高1TB)提升至48位(最高256TB)。
为了兜售西雅图芯片,AMD公司强调称大多数数据中心(例如前端Web服务器)在实际运作当中都不适合采用功耗惊人而且极端复杂的x86-64处理器,这类任务更应该被交由那些尺寸更小(因此能够在同一套机架中塞进更多系统)而且功耗更低(这也是ARM家族一直以来的最大卖点)的芯片来解决。
西雅图芯片的物理尺寸为27毫米x 27毫米,据称其热设计功耗为25瓦。相比之下,采用x86-64架构的八核心2GHz英特尔至强E7-4820 v2处理器为52毫米x 45毫米,热设计功耗则为105瓦——但需要承认,把二者直接比较其实并不算公平。
也许更公平的对比方式是将对手设定为英特尔凌动C2758处理器:八个x86-64核心、2.4GHz时钟速率、采用22纳米制程、34毫米x 28毫米尺寸、热设计功耗为20瓦——这款产品代表着英特尔对于低功耗数据中心市场潜在竞争关系所作出的反应。芯片巨头给出的答案非常明确:对其x86架构进行瘦身。
服务器软件在处理大规模并行请求时往往需要涉及规模庞大的数据集,由此带来的数据缓存缺失有可能带来高昂成本。有鉴于此,AMD方面表示,大家可以选择缓存更小且复杂程度更低的CPU方案、从而在保证低功耗水平的前提下实现高处理密度。
“西雅图是一款专为数据中心应用程序打造的密集型服务器处理器。其每瓦性能完全符合当下数据中心的设计要求,”AMD公司的Sean White在今天下午5:30分的Hot Chips大会主题演讲中指出。
“相当一部分数据中心工作负载其实只包含相当低的单位时钟指令(简称IPC)以及相当高的缓存缺失比例。对于此类工作负载,像西雅图这类核心处理能力与缓存容量相对较小的处理器能够提供与传统服务器处理器完全一致的处理效果,但却带来更低的功耗与占地空间。”
为西雅图构建软件与硬件
AMD公司还将展示其西雅图参考系统,两套该系统能够以2999美元构建起开发体系:一台2U顶架式设备,配备一套第三代PCIe 8插槽或者两套第三代PCIe 4插槽接口,最多支持接入八块硬盘驱动器、一块配备单一西雅图系统芯片的MicroATX主板、两个10Gbit以太网端口、四个I2C接口、两个串行端口、64位ARM Linux Fedora发行版、Java 7与8的ARMv8-A版本外加常见的CGG工具链。
当然,AMD公司并不是惟一一家致力于打造64位ARM芯片的厂商——虽然西雅图确实开了此类方案的先河。全志科技与三星电子希望将自己的方案引入便携式设备及手机等产品当中;苹果则已经以iPhone为舞台展示了其ARMv8-A兼容性系统芯片。初创企业Calxeda非常遗憾地无法在短时间内将其64位ARM核心推向市场,研发工作已经使其资金捉襟见肘。
西雅图芯片将由GlobalFoundries负责制造,并计划于2014年第四季度正式投放市场。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。