领导AMD芯片开发部门的高管Jack Huynh在今天发表的 Tom's Hardware 采访中透露了这一计划。
AMD提供两类显卡。第一类面向企业市场,使用的是名为CDNA 3的架构。该架构经过优化,可运行人工智能软件,尤其是大型语言模型。
人工智能模型在做出决策时会进行一些计算,其中涉及一些值为零的数据点。CDNA 3 可以将这些数据压缩成更紧凑的形式,从而减少GPU处理能力的使用,加快计算速度。该架构还包括其他几项旨在加快人工智能工作负载的优化。
反过来,AMD消费级GPU的设计针对的是电子游戏而非LLM,它们采用了名为RDNA 3的架构。该设计有别于CNDA 3的一个特点是它能更好地支持光线追踪技术,这是许多电子游戏用来渲染光影效果的一种技术。
在今天的采访中,Huynh透露AMD计划将RDNA和CDNA合并为一个芯片架构。这一未来技术将成为公司所有GPU的基础。他列举了决定统一设计的三个主要原因。
第一个原因是,开发一种而不是两种GPU架构将使 AMD的工程部门的运作更有效率。Huynh表示,改变方向背后的另一个因素是,该公司消费级GPU的架构RDNA有一定的设计限制。这些限制使得AMD的工程师在升级该架构的内存组件时面临挑战。
Huynh表示,芯片架构统一也将使第三方开发者受益。为一种芯片架构优化应用比为两种架构优化应用更简单,这将减轻软件团队的工作。
Huynh 还透露了AMD在高端消费级 GPU 市场的最新计划。该市场目前的领跑者是竞争对手英伟达,英伟达估计占芯片出货量的88%。AMD占据剩下的12%。
Huynh表示,AMD今后将优先考虑低成本显卡。该公司计划先扩大在这一市场的份额,然后再重新聚焦与英伟达的高端消费级GPU竞争。Huynh解释说,这一决定与开发人员的采用状况有关。
消费级GPU的需求水平在很大程度上受到针对其进行了运行优化的电子游戏数量的影响。AMD相信,提高其在低端 GPU 市场的份额将说服更多的开发商为其芯片优化游戏。一旦建立起这样的市场基础,AMD就能更好地在高端 GPU 领域与英伟达展开竞争。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。