ZDNet至顶网服务器频道 08月20日 编译:在受够了现在计算机芯片和相关知识产权的限制之后,加州大学伯克利分校的一群研究人员正在推动开源的替代品。RISC-V指令集架构最初是这所大学为了帮助学生学习计算机架构而开发的,但是现在它的创建者们希望将它推向主流,帮助推动云计算和物联网等新兴市场。
David Patterson 是RISC-V背后负责研究的人员之一,他是这个项目的创造者,他也是上个世纪八十年代最初的RISC指令集的创造者。他认为这是一个关于创新的问题。流行的芯片架构历史上已经被英特尔、ARM和IBM(虽然IBM已经针对行业合作伙伴开放了一些OpenPower的基础)等各大公司利用严格的许可证规则牢牢地锁死。他认为,即使是对于那些能够负担得起许可证费用的企业来说,他们得到的指令集可能也是复杂而臃肿的,需要付出大量的努力才能产生期待中的结果。
Patterson表示,今天很多处理器的架构实际上都是基于RISC的(包括IBM Power、ARM和MIPS)但是这些企业都通过专利制度对于他称之为“怪癖”的保护获得收益。这些架构本质上并没有什么不同,但是从技术上说却是不同的,并且需要指令集的操作。ARM——这家公司为高通、苹果、Marvell和其他一些公司智能手机芯片以及亚马逊和谷歌数据中心中的芯片提供设计技术——可能是现在最常见的例子。
尽管如此,如果你是一家大公司,并且能够负担得起从大型芯片厂商那里购买许可的费用,这也很不错,这些厂商花了很多钱和时间开发了一些非常好的技术。但是Patterson似乎一边看着窗外的小家伙一边表示——小型的公司或者研究者想要为自己特定的应用开发自己的芯片,可是他们没有多少钱。这就需要能够尝试下面的指令集,实验芯片设计并且公开分享自己的工作,而不用担心会违反许可条款。
Patterso表示,“要做到这一点,你必须要有一个不受限制的指令集。”
事实上,还有其他的开源指令集,包括OpenRISC和SPARC V8,以及IBM的OpenPower和基于MIPS的Prpl等行业基石。谈论后者是否能够得到、或者能够得到多少动力——特别是在小型企业、个人用户和大学之中——现在还为时尚早。Patterson表示开放源代码社区从来也没有真正地走上OpenRISC和SPARC V8之路。
Patterson和他的同事几个月前才意识到他们应该尝试着将RISC-V推广到教室之外,因为有“足够绝望也足够有兴趣”的人问他们自己是否能够获得它。目前加州大学伯克利分校已经基于RISC-V创造了几个核心,其他的一些机构还有多个项目正在进行之中。Patterson和他的同事Krste Asanovi近发表了一份技术文件介绍了RISC-V和它的技术规格,这份文件非常详尽。
Patterson表示RISC-V在很多方面能力更强也更有效率(甚至和一些私有的设计相比),现在是一个理想的时刻,因为它有一个小型的代码库和其他一些功能,这让它更适合芯片系统设计,芯片系统设计今天能够主宰计算世界主要归功于ARM。随着连接设备需求的演变,诸如Raspberry Pi之类的套件日趋成熟以及横向扩展云计算架构的成长,一个繁荣的RISC-V的社区应该能够设计出和它们共同进化的芯片来。
Patterson在回答我关于RISC-V 如何融入现有的开源项目——例如Facebook 创造的Open Compute Project的问题的时候表示,“我们认为为云计算设计个性化的硬件是有意义的,它会比标准处理器更有效率。”他还表示加州大学伯克利分校AMPLab实验室所做的工作是围绕着数据处理和分发系统的,他认为一个能够很方便进行定制的芯片架构还能够帮助解决容错的问题以及64位寻址存储空间在某些情况下可能出现的不足的问题。
Patterson表示,“我认为这是会发生的。”他表示,“硬件将会对客户和云计算更具针对性。”
好文章,需要你的鼓励
这篇研究介绍了KVzip,一种创新的查询无关KV缓存压缩方法,通过上下文重建机制为大型语言模型提供高效存储解决方案。该技术能将KV缓存大小减少394倍,同时提高解码速度约2倍,在各种任务上性能几乎不受影响。不同于传统查询相关的压缩方法,KVzip创建可在多种查询场景下重用的通用压缩缓存,特别适合个性化AI助手和企业信息检索系统。研究在LLaMA3.1-8B、Qwen2.5-14B和Gemma3-12B等多种模型上进行了验证,处理长度高达17万词元的文本,并能与KV缓存量化等其他优化技术无缝集成。
腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
这项研究揭示了大型语言模型(LLMs)偏好决策的内在机制。以色列理工学院和IBM研究院的团队开发了一种自动化方法,不需人工预设即可发现和解释影响AI判断的关键概念。研究横跨八个领域(从一般问答到安全评估),分析了12种偏好机制,发现人类评判者重视权威性和清晰度,而AI评判更关注事实准确性。他们提出的层次多领域回归模型不仅能准确预测偏好,还能清晰解释判断过程,为构建更透明、更符合人类价值观的AI系统提供了新途径。