ZDNet至顶网服务器频道 08月12日 编译:AMD公司今天在加利福尼亚州库比蒂诺召开的Hot Chips大会上披露了更多与其“西雅图”64位ARM架构处理器相关的信息。
只需对这块全新皓龙A1100系列系统芯片瞄上一眼,大家就会意识到这绝对是一款面向服务器的设备,而非针对手持硬件及嵌入式计算等ARM传统强项的产品,不过其未来在移动环境下亮相也并非不可能,AMD公司CEO Rory Read曾于今年四月作出过此类保证。
与预期相符,西雅图芯片拥有八个Cortex-A57计算核心——即ARM的顶级设计方案,运行64位ARMv8-A代码——并将利用28纳米制程技术进行制造。这些核心将运行在2GHz或者更高主频之下。
八核心西雅图系统芯片将配备4MB二级缓存与8MB三级缓存;双64位DDR3/4通道并具备ECC(即错误检查与纠正技术)机制,每条通道包含两套最高1866MHz的DIMM、单芯片最高支持128GB内存容量;控制器可支持八个6 Gbps SATA3端口、两个10Gbit以太网端口以及八条第三代PCIe通道。
西雅图还利用ARM的系统内存管理单元(简称SMMU)将之前提到的各类接口与其A57核心相对接。SMMU当中的S(系统)其实应该代表Super(超级)或者Steroids(兴奋剂)之意,这是因为SMMU的作用远远不止通常的地址转换或者访问保护那么简单:它允许虚拟机管理程序定义每一套访问系统转换表,并保持访客始终处于独立的物理内存池当中。SMMU设计方案已经出现数年之久,但其在虚拟化领域的应用仍主要集中在服务器级系统芯片层面。
而且如果大家对自己的当前系统芯片仍然满意,ARM也拿出了足以令人动心的设计——在系统芯片中加入另一套系统芯片:在一套系统控制处理器(简称SCP)当中包含一个配备64KB ROM与512KB SRAM的小型Cortex-A5核心;常用SPI、UART与I2C接口;TrustZone执行空间以及一个1Gbps以太网远程管理端口(RGMII)。
SCP的设计用途在于维护自身(在理论上)安全空间并执行代码的同时,启动、配置并监控主处理器。如果运行在主处理器上的系统发生故障,或者出现其它需要冷启动的状况,SCP能够及时接手设备的处理任务并借此避免停机事故。SCP的TrustZone组件能够确保系统始终以已知良好且安全的状态实现启动,这也成为系统可用性保障中的重要组成部分。
西雅图并不是惟一一款配备搭档CPU保持顺利运作的系统芯片——这类设计还有很多——但这种理念仍然值得称道。
计算机当中又有计算机……西雅图芯片当中实际包含两套系统、只不过有一套被隐藏了起来。
SCP采用UEFI 2.4,就是说在设备开启之后、该机制会首先对主系统芯片进行初始化,启用其自有实时操作系统,而后将其余任务交由A57启动核心处理、从而加载UEFI ARM固件。
虚拟机管理程序运行在我们的操作系统之下、又有操作系统运行在虚拟机管理程序之下……上图为西雅图处理器如何利用SCP完成启动。
其搭档处理器当中还包含一个专门用于密码算法加速的协处理器,其与SCP相对接或者通过内联机制接入SMMU。该协处理器提供一个随机数字生成器,而且能够与AES、Elliptic Curve Cryptography、RSA以及SHA等算法共同在硬件中实现zlib压缩与解压。
为什么用ARMv8-A取代x86-64?
说到这里,大家可能会提出质疑,为什么要采用ARM兼容CPU充当数据中心的处理中枢?ARM架构目前已经在服务器领域有所建树——最典型的例子就是将其嵌入至磁盘驱动器的控制器当中。但目前该架构的最大优势仍然源自低功耗与低复杂性,因此更适合依靠电池驱动的计算环境。是什么因素推动其一路向纯计算领域前进?这个问题确实让很多朋友捉摸不透。
ARM明显需要尽快迎接64位时代并借此跨入服务器领域:它已经向软件敞开了64位虚拟地址之门,并为来自英国的核心设计师们提供了一套与MIPS64相近的全新精简化指令集。ARM还利用物理内存优势扩大了可用空间,从而将该架构由40位物理地址(最高1TB)提升至48位(最高256TB)。
为了兜售西雅图芯片,AMD公司强调称大多数数据中心(例如前端Web服务器)在实际运作当中都不适合采用功耗惊人而且极端复杂的x86-64处理器,这类任务更应该被交由那些尺寸更小(因此能够在同一套机架中塞进更多系统)而且功耗更低(这也是ARM家族一直以来的最大卖点)的芯片来解决。
西雅图芯片的物理尺寸为27毫米x 27毫米,据称其热设计功耗为25瓦。相比之下,采用x86-64架构的八核心2GHz英特尔至强E7-4820 v2处理器为52毫米x 45毫米,热设计功耗则为105瓦——但需要承认,把二者直接比较其实并不算公平。
也许更公平的对比方式是将对手设定为英特尔凌动C2758处理器:八个x86-64核心、2.4GHz时钟速率、采用22纳米制程、34毫米x 28毫米尺寸、热设计功耗为20瓦——这款产品代表着英特尔对于低功耗数据中心市场潜在竞争关系所作出的反应。芯片巨头给出的答案非常明确:对其x86架构进行瘦身。
服务器软件在处理大规模并行请求时往往需要涉及规模庞大的数据集,由此带来的数据缓存缺失有可能带来高昂成本。有鉴于此,AMD方面表示,大家可以选择缓存更小且复杂程度更低的CPU方案、从而在保证低功耗水平的前提下实现高处理密度。
“西雅图是一款专为数据中心应用程序打造的密集型服务器处理器。其每瓦性能完全符合当下数据中心的设计要求,”AMD公司的Sean White在今天下午5:30分的Hot Chips大会主题演讲中指出。
“相当一部分数据中心工作负载其实只包含相当低的单位时钟指令(简称IPC)以及相当高的缓存缺失比例。对于此类工作负载,像西雅图这类核心处理能力与缓存容量相对较小的处理器能够提供与传统服务器处理器完全一致的处理效果,但却带来更低的功耗与占地空间。”
为西雅图构建软件与硬件
AMD公司还将展示其西雅图参考系统,两套该系统能够以2999美元构建起开发体系:一台2U顶架式设备,配备一套第三代PCIe 8插槽或者两套第三代PCIe 4插槽接口,最多支持接入八块硬盘驱动器、一块配备单一西雅图系统芯片的MicroATX主板、两个10Gbit以太网端口、四个I2C接口、两个串行端口、64位ARM Linux Fedora发行版、Java 7与8的ARMv8-A版本外加常见的CGG工具链。
当然,AMD公司并不是惟一一家致力于打造64位ARM芯片的厂商——虽然西雅图确实开了此类方案的先河。全志科技与三星电子希望将自己的方案引入便携式设备及手机等产品当中;苹果则已经以iPhone为舞台展示了其ARMv8-A兼容性系统芯片。初创企业Calxeda非常遗憾地无法在短时间内将其64位ARM核心推向市场,研发工作已经使其资金捉襟见肘。
西雅图芯片将由GlobalFoundries负责制造,并计划于2014年第四季度正式投放市场。
好文章,需要你的鼓励
Anthropic推出首个行业定制版AI产品Claude for Financial Services,专为金融行业打造。该服务基于Claude企业版,提供更高使用限制、内置数据连接器以及提示词库。新版本预装了连接FactSet、PitchBook等金融数据提供商的MCP连接器,并包含实施支持。针对金融分析师工作负载大的特点,该服务显著提升了速率限制,同时提供提示词库帮助用户更好地构建查询。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
多年来,Cursor、Windsurf和GitHub Copilot等代码编辑工具一直是AI编程的标准。但随着代理AI能力增强,AI系统正从处理代码转向直接与系统终端交互。Anthropic、DeepMind和OpenAI都推出了命令行编程工具。终端工具采用更广阔视角,不仅关注代码,还涉及整个程序运行环境,包括DevOps任务。研究显示传统代码助手可能降低效率,而Warp等终端工具在TerminalBench基准测试中表现出色,能够自主处理开发者的非编码工作。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。