作者:MARIA DEUTSCHER
更新时间:美国东部时间2024年5月30日16:43
科技行业最大的八家企业正在联手发起UALink Promoter Group,今天让我们来详细介绍这项新的人工智能硬件计划。
该项目致力于开发一种行业标准方法,将图形处理单元等人工智能芯片连接在一起。该计划的支持者表示,其目标是简化包含大量芯片的人工智能集群的组装。另外一个目标是提高基础设施的可扩展性。
UALink Promoter Group得到了芯片制造商英特尔、AMD和Broadcom的支持。云计算三巨头中的两家——微软和谷歌,以及Meta、思科和慧与也参与其中。它衬托出英伟达在GPU领域的领导地位,所有的系统都围绕着这些芯片。
该组织计划在第三季度成立一个正式的行业联盟来监督开发工作。UALink Consortium(该机构的名称)将在该季度晚些时候发布其人工智能互联技术的首轮迭代版本。参与该计划的公司将可以使用该规范。
先进的人工智能模型通常不是使用一个而是多个处理器进行训练。每个处理器运行正在开发的神经网络的独立副本,并用训练数据集中的一小部分数据对其进行训练。为了完成开发过程,这些芯片需要同步各自的神经网络副本,这就需要有一个渠道让这些芯片可以相互交换数据。
这正是UALink Consortium计划中的互联所要满足的要求。据该组织称,这项技术将使在单个集群中连接多达1024个人工智能加速器成为可能。此外,UALink 还能将这些集群连接到网络交换机,后者可以帮助优化各个处理器之间的数据流量。
该联盟表示,正在开发的功能之一是促进“加速器所附内存之间的直接加载和存储”。促进对人工智能芯片内存的直接访问是加速机器学习应用的一种方式。英伟达在其数据中心显卡上采用的GPUDirect也是此类技术。
通常情况下,从一个GPU传输到另一个GPU的数据在到达目的地之前要经过几个中转站。特别是,信息必须经过显卡所在服务器的中央处理器。英伟达的GPUDirect技术可以绕过中央处理器,让数据更快地到达目的地,从而加快处理速度。
UALink Consortium至少是过去五年中成立的第三个专注于人工智能芯片的行业组织。
人工智能集群不仅包括机器学习加速器,还包括执行各种支持任务的CPU。2019年,英特尔发布了一种名为CXL的互连技术,可以将人工智能加速器与CPU连接起来。它还成立了一个行业联盟,促进该标准的开发和采用。
CXL是PCIe互连的定制版本,后者广泛用于服务器组件的连接。英特尔对后者的技术进行了修改,针对人工智能进行了多项优化。其中一项优化允许人工智能集群中相互连接的CPU和GPU互相共享内存,从而能够更高效地交换数据。
去年,英特尔与Arm以及其他几家芯片制造商合作,成立了一个名为UXL基金会(UXL Foundation)的人工智能软件联盟。该组织的目标是简化可在多种类型机器学习加速器上运行的人工智能应用的开发。为此,UXL基金会正在基于oneAPI进行开发,oneAPI是一个用于构建多处理器软件的工具包,最初由英特尔开发。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。