英特尔Habana实验室今天表示,将为加利福尼亚大学圣迭戈分校提供数百个人工智能芯片,并将这些芯片整合到即将上线的Voyager研究用超级计算机中。

科学家将使用Voyager超级计算机运行诸如粒子加速器实验数据分析之类的项目。
英特尔在2019年以20亿美元的价格收购了刚走出隐身模式仅仅两年时间的Habana Labs。Habana Labs提供了两款AI芯片——Gaudi和Goya,分别用于训练机器学习模型和执行推理任务。
Habana称,由于该架构中内置了许多提高效率的功能,因此在某些情况下,Habana Labs的芯片运行AI工作负载的效率高于GPU,主要亮点是每个芯片上都配置了10个100千兆以太网端口。
由于训练和运行AI软件需要大量运算,因此通常需要将工作负载分配到大量处理器上,这些处理器又必须相互连接,通过网络接口卡协调运行计算任务。通常每个设备需要配置一个这种芯片,这可能会大大增加构建大型机器学习系统(如AI优化的超级计算机)的成本。
每个Habana Labs芯片中内置的10个以太网端口使得不在需要独立的网络接口卡。据Habana Labs称,这不仅降低硬件要求从而降低了系统成本,而且还可以提高性能。此前AWS计划推出基于Habana Labs Gaudi AI训练芯片的实例系列,AWS表示,这与GPU实例相比,性价比可提高40%。
加州大学圣地亚哥分校的Voyager超级计算机将配备336个Gaudi芯片和16个推理优化型Goya芯片。研究人员将利用该超级计算开发定制的AI模型以及新的机器学习技术,用于计算科学实验。
作为该项目的一部分,加州大学圣地亚哥分校的技术合作伙伴Super Micro将把Habana Labs的芯片整合到两组计算模块中,这将构成Voyager的基本构建块。第一组模块将各自配置8个Gaudi芯片和2个第三代英特尔Xeon Scalable CPU,另一组模块将配置8个Goya推理芯片与第二代Xeon Scalable CPU。
Voyager系统将于今年秋季上线,届时将开始为期三年的“测试阶段”,在此期间,Voyager将被来自天文学、气候学、化学和粒子物理学等领域的众多研究团队所使用,他们将探索利用超级计算机AI芯片的各种方法,并且随着该校逐渐扩大Voyager的使用范围,这些研究团队也将开发相关技术文档并与其他科学家进行共享。
好文章,需要你的鼓励
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。
中科大联合快手等机构推出VR-Thinker技术,首次实现AI视频评判员的"边看边想"能力。该系统通过主动选择关键画面、智能记忆管理和三阶段训练,在视频质量评估准确率上达到75%-82%,特别擅长处理长视频场景,为AI视频生成的质量控制提供了突破性解决方案。
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。
微软研究院发布BitDistill技术,通过三阶段优化将大型语言模型压缩至1.58位精度,在保持性能的同时实现10倍内存节省和2.65倍速度提升。该技术包括模型结构稳定化、持续预训练适应和知识蒸馏传承三个关键步骤,解决了模型量化中的性能衰减和规模化问题,为AI模型在资源受限设备上的高效部署提供了新方案。