领导AMD芯片开发部门的高管Jack Huynh在今天发表的 Tom's Hardware 采访中透露了这一计划。
AMD提供两类显卡。第一类面向企业市场,使用的是名为CDNA 3的架构。该架构经过优化,可运行人工智能软件,尤其是大型语言模型。
人工智能模型在做出决策时会进行一些计算,其中涉及一些值为零的数据点。CDNA 3 可以将这些数据压缩成更紧凑的形式,从而减少GPU处理能力的使用,加快计算速度。该架构还包括其他几项旨在加快人工智能工作负载的优化。
反过来,AMD消费级GPU的设计针对的是电子游戏而非LLM,它们采用了名为RDNA 3的架构。该设计有别于CNDA 3的一个特点是它能更好地支持光线追踪技术,这是许多电子游戏用来渲染光影效果的一种技术。
在今天的采访中,Huynh透露AMD计划将RDNA和CDNA合并为一个芯片架构。这一未来技术将成为公司所有GPU的基础。他列举了决定统一设计的三个主要原因。
第一个原因是,开发一种而不是两种GPU架构将使 AMD的工程部门的运作更有效率。Huynh表示,改变方向背后的另一个因素是,该公司消费级GPU的架构RDNA有一定的设计限制。这些限制使得AMD的工程师在升级该架构的内存组件时面临挑战。
Huynh表示,芯片架构统一也将使第三方开发者受益。为一种芯片架构优化应用比为两种架构优化应用更简单,这将减轻软件团队的工作。
Huynh 还透露了AMD在高端消费级 GPU 市场的最新计划。该市场目前的领跑者是竞争对手英伟达,英伟达估计占芯片出货量的88%。AMD占据剩下的12%。
Huynh表示,AMD今后将优先考虑低成本显卡。该公司计划先扩大在这一市场的份额,然后再重新聚焦与英伟达的高端消费级GPU竞争。Huynh解释说,这一决定与开发人员的采用状况有关。
消费级GPU的需求水平在很大程度上受到针对其进行了运行优化的电子游戏数量的影响。AMD相信,提高其在低端 GPU 市场的份额将说服更多的开发商为其芯片优化游戏。一旦建立起这样的市场基础,AMD就能更好地在高端 GPU 领域与英伟达展开竞争。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。