作者:MARIA DEUTSCHER
更新时间:美国东部时间2024年5月30日16:43
科技行业最大的八家企业正在联手发起UALink Promoter Group,今天让我们来详细介绍这项新的人工智能硬件计划。
该项目致力于开发一种行业标准方法,将图形处理单元等人工智能芯片连接在一起。该计划的支持者表示,其目标是简化包含大量芯片的人工智能集群的组装。另外一个目标是提高基础设施的可扩展性。
UALink Promoter Group得到了芯片制造商英特尔、AMD和Broadcom的支持。云计算三巨头中的两家——微软和谷歌,以及Meta、思科和慧与也参与其中。它衬托出英伟达在GPU领域的领导地位,所有的系统都围绕着这些芯片。
该组织计划在第三季度成立一个正式的行业联盟来监督开发工作。UALink Consortium(该机构的名称)将在该季度晚些时候发布其人工智能互联技术的首轮迭代版本。参与该计划的公司将可以使用该规范。
先进的人工智能模型通常不是使用一个而是多个处理器进行训练。每个处理器运行正在开发的神经网络的独立副本,并用训练数据集中的一小部分数据对其进行训练。为了完成开发过程,这些芯片需要同步各自的神经网络副本,这就需要有一个渠道让这些芯片可以相互交换数据。
这正是UALink Consortium计划中的互联所要满足的要求。据该组织称,这项技术将使在单个集群中连接多达1024个人工智能加速器成为可能。此外,UALink 还能将这些集群连接到网络交换机,后者可以帮助优化各个处理器之间的数据流量。
该联盟表示,正在开发的功能之一是促进“加速器所附内存之间的直接加载和存储”。促进对人工智能芯片内存的直接访问是加速机器学习应用的一种方式。英伟达在其数据中心显卡上采用的GPUDirect也是此类技术。
通常情况下,从一个GPU传输到另一个GPU的数据在到达目的地之前要经过几个中转站。特别是,信息必须经过显卡所在服务器的中央处理器。英伟达的GPUDirect技术可以绕过中央处理器,让数据更快地到达目的地,从而加快处理速度。
UALink Consortium至少是过去五年中成立的第三个专注于人工智能芯片的行业组织。
人工智能集群不仅包括机器学习加速器,还包括执行各种支持任务的CPU。2019年,英特尔发布了一种名为CXL的互连技术,可以将人工智能加速器与CPU连接起来。它还成立了一个行业联盟,促进该标准的开发和采用。
CXL是PCIe互连的定制版本,后者广泛用于服务器组件的连接。英特尔对后者的技术进行了修改,针对人工智能进行了多项优化。其中一项优化允许人工智能集群中相互连接的CPU和GPU互相共享内存,从而能够更高效地交换数据。
去年,英特尔与Arm以及其他几家芯片制造商合作,成立了一个名为UXL基金会(UXL Foundation)的人工智能软件联盟。该组织的目标是简化可在多种类型机器学习加速器上运行的人工智能应用的开发。为此,UXL基金会正在基于oneAPI进行开发,oneAPI是一个用于构建多处理器软件的工具包,最初由英特尔开发。
好文章,需要你的鼓励
丰田第六代RAV4搭载高通骁龙数字底盘平台,提供个性化、直观且无缝连接的驾驶体验。新车基于丰田Arene软件开发平台,推进软件定义汽车发展,配备紧急驾驶停止系统和突然加速抑制功能。车载多媒体系统支持个性化主屏幕定制和更准确的语音识别。通过与高通技术公司合作,利用先进AI技术增强用户体验,提供更智能、直观和安全的出行方案。
上海AI实验室开发RePro训练方法,通过将AI推理过程类比为优化问题,教会AI避免过度思考。该方法通过评估推理步骤的进步幅度和稳定性,显著提升了模型在数学、科学和编程任务上的表现,准确率提升5-6个百分点,同时大幅减少无效推理,为高效AI系统发展提供新思路。
Chainguard发布可信开源软件季度报告,基于1800多个容器镜像项目和近5亿次构建的数据分析。报告显示:Python因AI需求成为最受欢迎的开源镜像;超半数生产环境运行在热门项目之外的长尾镜像上;98%的漏洞出现在非热门项目中,安全负担主要集中在不太显眼的技术栈部分;44%客户在生产环境中使用FIPS镜像以满足合规要求;Chainguard平均在20小时内修复关键漏洞。
MIT团队开发的VLASH技术首次解决了机器人动作断续、反应迟缓的根本问题。通过"未来状态感知"让机器人边执行边思考,实现了最高2.03倍的速度提升和17.4倍的反应延迟改善,成功展示了机器人打乒乓球等高难度任务,为机器人在动态环境中的应用开辟了新可能性。