芯片初创公司SiFive Inc.今日发布四款专为运行人工智能模型优化的新型中央处理器核心。
总部位于加利福尼亚州圣克拉拉的SiFive在2022年最新一轮融资后估值达25亿美元。该公司基于开源RISC-V指令集架构(ISA)开发CPU设计。ISA定义了芯片混合匹配处理数据时使用的底层计算操作集合。
SiFive的新核心通过添加向量扩展来扩展RISC-V的功能集。这些组件使芯片能够更高效地同时处理多个数据点。并行计算能力可以显著加速大语言模型,这些模型使用大量相对简单的计算来处理数据。
新产品线以X160和X180为主打。两款设计都包含向量处理功能,可加速卷积运算,这是计算机视觉模型处理图像时使用的计算。这些功能还可以加速某些数据过滤和转换任务。
X160和X180都可配置为运行实时操作系统。这是一种确保计算始终在预定时间内完成的操作系统,对某些系统很重要。例如,制造商可能希望保证工厂传感器在检测到设备故障后的三秒内总是产生警报。
X160配备高达200千字节的缓存和2兆字节内存。除了工业设备,SiFive还认为该芯片可用于健身追踪器等消费设备。此外,X160可以安装在包含多个AI加速器的系统中,用于管理芯片和阻止固件篡改。
X180比X160快10%。它还可以通过两个内置缓存存储更多数据,总容量超过4兆字节。据SiFive称,该芯片适用于训练大语言模型和为某些类型的数据中心设备供电。
该公司今日发布的另外两款核心是现有设计的升级版本。X280面向增强现实头显等消费设备,而X390还可以为汽车和基础设施系统供电。后者的向量处理速度提高了四倍。
据SiFive介绍,其工程师通过新的协处理器接口增强了这两款设计。该技术将使核心更容易集成到同样包含AI加速器的片上系统中。此外,该公司还升级了X280和X390的内存子系统以减少延迟。
SiFive预计客户将在2026年第二季度开始生产基于其新核心设计的芯片。
Q&A
Q1:SiFive的RISC-V处理器核心有什么特点?
A:SiFive基于开源RISC-V指令集架构开发CPU设计,新核心通过添加向量扩展来提升功能,使芯片能够更高效地同时处理多个数据点,从而显著加速人工智能模型的运行。
Q2:X160和X180处理器核心主要应用在哪些场景?
A:X160配备200千字节缓存和2兆字节内存,适用于工业设备、健身追踪器等消费设备,以及管理多AI加速器系统。X180性能比X160快10%,缓存容量超过4兆字节,主要用于训练AI模型和数据中心设备。
Q3:SiFive什么时候能量产这些新的处理器核心?
A:据SiFive预计,客户将在2026年第二季度开始生产基于其新核心设计的芯片。目前这些设计还处于发布阶段,需要时间进行系统集成和制造准备。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。