作者:MARIA DEUTSCHER
更新时间:美国东部时间2024年5月30日16:43
科技行业最大的八家企业正在联手发起UALink Promoter Group,今天让我们来详细介绍这项新的人工智能硬件计划。
该项目致力于开发一种行业标准方法,将图形处理单元等人工智能芯片连接在一起。该计划的支持者表示,其目标是简化包含大量芯片的人工智能集群的组装。另外一个目标是提高基础设施的可扩展性。
UALink Promoter Group得到了芯片制造商英特尔、AMD和Broadcom的支持。云计算三巨头中的两家——微软和谷歌,以及Meta、思科和慧与也参与其中。它衬托出英伟达在GPU领域的领导地位,所有的系统都围绕着这些芯片。
该组织计划在第三季度成立一个正式的行业联盟来监督开发工作。UALink Consortium(该机构的名称)将在该季度晚些时候发布其人工智能互联技术的首轮迭代版本。参与该计划的公司将可以使用该规范。
先进的人工智能模型通常不是使用一个而是多个处理器进行训练。每个处理器运行正在开发的神经网络的独立副本,并用训练数据集中的一小部分数据对其进行训练。为了完成开发过程,这些芯片需要同步各自的神经网络副本,这就需要有一个渠道让这些芯片可以相互交换数据。
这正是UALink Consortium计划中的互联所要满足的要求。据该组织称,这项技术将使在单个集群中连接多达1024个人工智能加速器成为可能。此外,UALink 还能将这些集群连接到网络交换机,后者可以帮助优化各个处理器之间的数据流量。
该联盟表示,正在开发的功能之一是促进“加速器所附内存之间的直接加载和存储”。促进对人工智能芯片内存的直接访问是加速机器学习应用的一种方式。英伟达在其数据中心显卡上采用的GPUDirect也是此类技术。
通常情况下,从一个GPU传输到另一个GPU的数据在到达目的地之前要经过几个中转站。特别是,信息必须经过显卡所在服务器的中央处理器。英伟达的GPUDirect技术可以绕过中央处理器,让数据更快地到达目的地,从而加快处理速度。
UALink Consortium至少是过去五年中成立的第三个专注于人工智能芯片的行业组织。
人工智能集群不仅包括机器学习加速器,还包括执行各种支持任务的CPU。2019年,英特尔发布了一种名为CXL的互连技术,可以将人工智能加速器与CPU连接起来。它还成立了一个行业联盟,促进该标准的开发和采用。
CXL是PCIe互连的定制版本,后者广泛用于服务器组件的连接。英特尔对后者的技术进行了修改,针对人工智能进行了多项优化。其中一项优化允许人工智能集群中相互连接的CPU和GPU互相共享内存,从而能够更高效地交换数据。
去年,英特尔与Arm以及其他几家芯片制造商合作,成立了一个名为UXL基金会(UXL Foundation)的人工智能软件联盟。该组织的目标是简化可在多种类型机器学习加速器上运行的人工智能应用的开发。为此,UXL基金会正在基于oneAPI进行开发,oneAPI是一个用于构建多处理器软件的工具包,最初由英特尔开发。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。