ZDNet至顶网服务器频道 08月20日 编译:在受够了现在计算机芯片和相关知识产权的限制之后,加州大学伯克利分校的一群研究人员正在推动开源的替代品。RISC-V指令集架构最初是这所大学为了帮助学生学习计算机架构而开发的,但是现在它的创建者们希望将它推向主流,帮助推动云计算和物联网等新兴市场。
David Patterson 是RISC-V背后负责研究的人员之一,他是这个项目的创造者,他也是上个世纪八十年代最初的RISC指令集的创造者。他认为这是一个关于创新的问题。流行的芯片架构历史上已经被英特尔、ARM和IBM(虽然IBM已经针对行业合作伙伴开放了一些OpenPower的基础)等各大公司利用严格的许可证规则牢牢地锁死。他认为,即使是对于那些能够负担得起许可证费用的企业来说,他们得到的指令集可能也是复杂而臃肿的,需要付出大量的努力才能产生期待中的结果。
Patterson表示,今天很多处理器的架构实际上都是基于RISC的(包括IBM Power、ARM和MIPS)但是这些企业都通过专利制度对于他称之为“怪癖”的保护获得收益。这些架构本质上并没有什么不同,但是从技术上说却是不同的,并且需要指令集的操作。ARM——这家公司为高通、苹果、Marvell和其他一些公司智能手机芯片以及亚马逊和谷歌数据中心中的芯片提供设计技术——可能是现在最常见的例子。
尽管如此,如果你是一家大公司,并且能够负担得起从大型芯片厂商那里购买许可的费用,这也很不错,这些厂商花了很多钱和时间开发了一些非常好的技术。但是Patterson似乎一边看着窗外的小家伙一边表示——小型的公司或者研究者想要为自己特定的应用开发自己的芯片,可是他们没有多少钱。这就需要能够尝试下面的指令集,实验芯片设计并且公开分享自己的工作,而不用担心会违反许可条款。
Patterso表示,“要做到这一点,你必须要有一个不受限制的指令集。”
事实上,还有其他的开源指令集,包括OpenRISC和SPARC V8,以及IBM的OpenPower和基于MIPS的Prpl等行业基石。谈论后者是否能够得到、或者能够得到多少动力——特别是在小型企业、个人用户和大学之中——现在还为时尚早。Patterson表示开放源代码社区从来也没有真正地走上OpenRISC和SPARC V8之路。
Patterson和他的同事几个月前才意识到他们应该尝试着将RISC-V推广到教室之外,因为有“足够绝望也足够有兴趣”的人问他们自己是否能够获得它。目前加州大学伯克利分校已经基于RISC-V创造了几个核心,其他的一些机构还有多个项目正在进行之中。Patterson和他的同事Krste Asanovi近发表了一份技术文件介绍了RISC-V和它的技术规格,这份文件非常详尽。
Patterson表示RISC-V在很多方面能力更强也更有效率(甚至和一些私有的设计相比),现在是一个理想的时刻,因为它有一个小型的代码库和其他一些功能,这让它更适合芯片系统设计,芯片系统设计今天能够主宰计算世界主要归功于ARM。随着连接设备需求的演变,诸如Raspberry Pi之类的套件日趋成熟以及横向扩展云计算架构的成长,一个繁荣的RISC-V的社区应该能够设计出和它们共同进化的芯片来。
Patterson在回答我关于RISC-V 如何融入现有的开源项目——例如Facebook 创造的Open Compute Project的问题的时候表示,“我们认为为云计算设计个性化的硬件是有意义的,它会比标准处理器更有效率。”他还表示加州大学伯克利分校AMPLab实验室所做的工作是围绕着数据处理和分发系统的,他认为一个能够很方便进行定制的芯片架构还能够帮助解决容错的问题以及64位寻址存储空间在某些情况下可能出现的不足的问题。
Patterson表示,“我认为这是会发生的。”他表示,“硬件将会对客户和云计算更具针对性。”
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。