在宣布美国能源部(DOE)的El Capitan百亿亿次超级计算机采用AMD最新设计的第二天,AMD就召开了2020年金融分析师日(FAD)。在分析师日期间,AMD公布了新的财务目标,以及产品路线图的一些相关公布。自2006年以来,无论从财务还是产品角度来看,AMD都处于有史以来最健康的状态。
AMD首席执行官Lisa Su博士在简要介绍了过去五年的情况之后,她阐述了AMD的整体战略和定位。过去五年中,AMD从一家负债累累的厂商,变成一家净现金充裕的厂商,并且制定了激进的产品路线图,表现出巨大的增长潜力。AMD还强调了AMD在执行计划和实现关键产品里程碑方面的突出能力。例如,AMD Milan EPYC服务器处理器的Zen 3 CPU核心有望在2020年出货。而且,过去5年,AMD的年复合增长率达到了14%。
未来五年的战略,是基于AMD对高性能计算市场的承诺,将创造结合了AMD CPU和GPU架构的颠覆性解决方案。Lisa Su博士还透露,AMD把GPU路线图分成两支,增加一个计算产品——CDNA(C指计算)的单独路径,同时保留面向控制台和PC的RDNA(R指Radeon)图形路线图。AMD将对封装、工艺、3D裸片堆叠和快速互连方面进行重大投资。
AMD的主要目标市场是数据中心和通信,总潜在市场规模为350亿美元。PC市场的总潜在规模为320亿美元,消费类图形和游戏产品为120亿美元。另外一个新的重点领域是电信市场,在该市场中,5G服务部署将需要用于控制平面和边缘服务器的处理器。
AMD在这些新目标的基础上,更新了预测,拿出了更激进的财务目标。AMD期望复合年增长率达到20%,毛利率显着提高,营业利润率保持稳定,自由现金流有所改善。
在Lisa Su博士之后,AMD的其他高管介绍了产品和市场方面的更新。
在消费类PC方面,AMD计划继续提高Ryzen处理器系列的性能和电池寿命。笔记本电脑占到了总体潜在市场的64%,AMD不断提升电池续航能力,电池续航时间长达18小时。随着AMD不断改进移动处理器,市场份额也随之增加——2019年达到了16%。
图形方面, AMD已经推出了RDNA图形架构,Su博士介绍说,该架构将持续5年时间,将同时用于游戏机和PC。去年AMD以7纳米Navi芯片的形式发布了第一代RDNA架构。与上一代产品相比,每瓦性能有了显着提高。AMD是游戏机显卡位列第一的厂商,已经出货超过1.5亿个。AMD预计,将在2020年底之前交付下一代7nm RDNA 2图形芯片,其中将包括多项高级功能,例如具有竞争力的4K性能、硬件光线跟踪支持、可变速率阴影技术。RDNA 3芯片预计将在2022年出货,未确定“先进工艺节点”。
AMD CPU路线图显示,AMD有望于今年下半年在Milan服务器处理器中交付7纳米Zen 3核心。5纳米Zen 4 Genoa CPU是El Capitan百亿亿级超级计算机所采用的CPU。该超级计算机将于2021年末开始制造,并于2022年投入使用。AMD在服务器市场的份额也将在第二季度超过10%,这也是AMD过去十年中服务器份额首次达到两位数。
AMD在分析师日期间透露,El Capitan采用的GPU是AMD专门针对计算任务设计的第二代GPU新架构,而不是重新设计的消费类图形芯片。新的CDNA将取消面向图形的硅芯片结构,添加张量核心、高可靠性功能、以及其他安全元素。CDNA还通过第三代Infinity Architecture提供更多可扩展性。第一款CDNA芯片将采用7纳米,第二代芯片将采用尚未定义的“高级节点”,并用于El Capitan超级计算机。AMD没有透露明确的制程节点名,因为代工厂仍在调整命名约定。
AMD预计,数据中心GPU市场的总潜在规模为110亿美元,包括人工智能、云游戏和虚拟桌面(VDI)应用。AMD在RDNA GPU中提供了硬件虚拟化功能,并已经在微软Azure NVv4 Gen 7中进行了部署。
AMD之所以能够拿下El Capitan设计订单,关键在于工艺和体系结构开发——AMD将采用一种互连战略,允许CPU和GPU共享一致的内存体系结构。共享内存体系结构将首先用于Frontier超级计算机。这种结构通过以统一内存阵列的方式进行管理,来简化软件开发,并减少CPU和GPU内存之间数据复制。El Capitan超级计算机将采用第三代AMD Infinity Fabric以实现CPU和GPU的互连,AMD承诺这将让吞吐量在目前第二代基础上翻一番。新的互连技术还可以实现4到8路的GPU连接。El Capitan的设计是把4个CDNA GPU连接到1个EPYC CPU。
关于工艺技术路线图,AMD坚持认为,台积电的7纳米晶体管密度和每瓦性能是优于英特尔14纳米工艺的。AMD还认为,相信,即使英特尔解决了工艺路线图,但10纳米工艺的延迟,意味着三星和台积电代工厂在未来几年内将保持领先或与英特尔持平。因此,现在竞争日趋激烈,甚至首先向AMD倾斜。
支撑这一发展势头的基础,是确保安全性。为此,AMD加入了由阿里巴巴、ARM、谷歌云、华为、英特尔、微软和红帽成立的机密计算联盟(Confidential Compute Consortium)。AMD将继续在CPU上内置安全处理器。英特尔也在最近举行安全日活动中,做出了在处理器中内置专用安全控制器的类似承诺。
如果说AMD的计划中存在薄弱环节,那一定不是芯片策略,但如果说到软件,AMD的路线图就不那么容易预测了。AMD严重依赖于开源策略,AMD自己的开源ROCm软件中间层提供了能够取代NVIDIA专有CUDA和英特尔OneAPI的替代选择。美国能源部的El Capitan合同除了能带来充沛的资金之外,另一方面也会让ROCm更加强大。
AMD已经在软件方面取得了一些进步。机器学习框架Pytorch和TensorFlow现在已经运行在Radeon Instinct GPU上。AMD也在不断改进ROCm软件,Pytorch的性能从ROCm 2.0到今年底出货3.0版本的时候将翻一番。
Su博士还谈到了新冠病毒的影响,她说,供应链运转接近正常,但客户方面确实看到了一些影响。目前全球需求基本正常,但中国市场正在下降。远程工作人数激增加大了云服务的负担,因此对基础架构的需求更高。总体来说,AMD没有调整第二季度指引——只是可能处于最初指引水平的低位。
我们从AMD金融分析师日和英特尔简报会看到了一个主题:越来越多的重度计算将在云或其他数据中心进行,而客户端设备将更多地关注移动、连接、便利性、低功耗、更长的电池寿命、更小的尺寸。5G和WiFi6的推出将加速这一趋势。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。