Habana Labs正在人工智能市场中向Nvidia发起挑战。
这家以色列初创公司(已经累计融资1.2亿美元)今天推出了一款名为Gaudi(如图)的芯片,专门用于训练人工智能模型。
工程师通过反复试验来验证算法的性能,这是开发生命周期的一个部分。要让AI完成某个任务可能需要经过数千万次尝试,因此任何加速该过程的技术都有可能带来巨大回报。
Gaudi承诺将提供在性能上有重大提升。为了展示其速度,Habana Labs进行了一项内部测试,将Gaudi与Nvidia旗舰的V100数据中心图形卡进行了对比。Habana Labs称Gaudi运行ResNet-50主流AI模型基准测试的速度要比V100快3.8倍,在此过程中创造了性能纪录。
这是Habana Labs在过去一年中第二次打破RestNet-50记录,第一次是Habana Labs的Goya芯片,该芯片旨在为已经经过训练、用于生产处理实时数据的人工智能模型提供动力。
Gaudi与Goya采用了共同的设计理念,都是基于所谓超长指令字架构的八个处理核心组成,并行执行计算而不是像CPU那样逐个执行计算任务。Gaudi与众不同之处在于它的内存不同,而且吞吐量也更适合于人工智能训练。
Habana Labs将以两种形式把Gaudi推向市场:PCIe卡和夹层加速器,设计用于加载到其他更大的卡上。此外Habana Labs还开发了一款名为HLS的数据中心设备,装有8个夹层加速器。
除了处理速度快之外,Gaudi还是可扩展的。夹层卡和PCIe卡分别采用8个和10个内置以太网端口,每个端口支持100Gb连接,这样就不需要额外的芯片来应对网络需求,提高配置了大量Gaudi处理器的大规模人工智能环境的效率。
Habana Labs计划今年晚些时候生产Gaudi芯片样品,并称已经有多加客户采用了早期的Goya处理器,包括几家云提供商和自动驾驶汽车公司。Habana Labs还得到了大厂商的支持,最近一轮7500万美元的融资是由英特尔领投的,其他投资方还包括Bessemer Venture Partners、Battery Ventures等。
好文章,需要你的鼓励
迪士尼研究院开发了一种让双足机器人学会优雅跌倒的新技术。通过强化学习,机器人能够在跌倒时既减少冲击力保护关键部件,又达到用户指定的艺术化姿势。
土耳其中东技术大学研究团队开发出TimesNet-Gen人工智能系统,能够学习不同地点的地质特征并生成逼真的地震波形。该系统通过分析历史地震数据,为每个监测站建立独特的"地震指纹",在专业评估中获得0.93分高分,显著优于传统方法。这项技术为建筑抗震设计、地震预警系统和风险评估等领域提供了重要工具。
微软开始在最新Windows 11预览版中推出模型上下文协议(MCP)原生支持的公开预览,这使其备受瞩目的"智能代理操作系统"愿景更接近现实。该更新包含文件资源管理器和Windows设置两个连接器,允许AI代理在用户同意下访问本地文件和修改设备设置。尽管功能强大,微软仍需应对用户对其AI野心的不安和不信任情绪。
这项香港科技大学等机构的联合研究提出了SQ-format数据格式,通过混合精度处理实现了大语言模型性能的显著提升。该技术能智能识别模型中的关键信息并分配相应的处理精度,在几乎不损失准确性的前提下将运行速度提升近一倍。研究包含完整的算法设计、硬件实现方案和大量实验验证,为未来AI加速器的软硬件协同设计提供了重要参考。