放眼未来,专用芯片与电路可能无法拯救整个计算机行业。
时至今日,加速器早已无处不在:世界上的比特币大多由用于加速加密货币核心算法的芯片采矿得来,几乎每一种能够发出声音的数字产品都在使用硬连线音频解码器;而且当前亦有数十家初创企业在探索速度更快的专用芯片,旨在真正推动深度学习AI实现普及。这种专用化趋势,使得各类原本运行在通用CPU之上的软件及其内部常见算法得以在定制化硬件上带来更快的处理速度。但必须承认,从悲观角度来讲,这也是摩尔定律失效之后,我们能够在接下来一到两代芯片当中继续驱动计算能力保持增长的少数可行方法之一。
但更遗憾的是,这种过渡性方案也即将走向终点——至少将有不久的将来耗尽一切潜能空间。普林斯顿大学电气工程学副教授David Wentzlaff和他的博士生Adi Fuchs即将在本月IEEE国际高性能计算机架构研讨会上就这一研究方向提出重要结论。根据他们计算出的结果,芯片专用化无法带来与摩尔定律相契合的性能收益。换句话说,加速器的发展即将向已经开始萎缩的晶体管那样走向尽头,而且这一切的来临都要远早于人们的预期。
为了证明他们的观点,Fuchs与Wentzlaff首先需要弄清楚近期芯片中表现出的性能提升之内,有多大比例来自芯片专用化调整,又有多大比例源自摩尔定律本身。这意味着他们需要检查1000多份芯片数据表,同时弄清这些不同型号处理器中的哪些性能组成部分源自更好的算法,又有哪些由更巧妙的电路实现方法所贡献。更具体地讲,他们希望把这段时间半导体行业内的人类聪明才智进行一番量化统计。
为了实现这一目标,他们采取了工程师最擅长的方法:将问题转换为无量纲量。他们将其称为芯片专用化回归,并希望借此解决这样一个问题:“晶体管的计算能力在晶体管自身的固体物理潜能空间中还有多大的改善余地?”
利用这一指标,他们评估了特定应用集成电路(简称ASIC)上的视频解码性能,在GPU上测试游戏帧率,在FPGA上测试卷积神经网络并在ASIC上尝试比特币采矿。然而,得出的结果令人相当沮丧:专用芯片的增益在很大程度上仍然源自每平方毫米内可用晶体管数量的增加。换句话说,如果没有摩尔定律的支持,芯片专用化本身并不能带来显著的性能提升。
因此,如果专用化无法给出理想的答案,那么未来的出路在哪里?Wentzlaff建议半导体业界学习使用那些能够在逻辑停止时仍可实现扩展的事物进行计算。举例来说,每平方厘米内的可用闪存bit数能够不断增加,这与摩尔定律无关,因为业界已经开始能够制造出256层甚至更高单元层数的3D堆叠技术。Fuchs与Wentzlaff已经开始就这一方向展开探索,他们希望开发出一种新的计算机架构,通过让处理器查找存储在内存当中的原有计算结果(而非重新进行计算)来加快计算速度。
Wentzlaff最后总结道,摩尔定律的终结“并不是世界末日。但很明显,我们仍然需要为此做好准备。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。