放眼未来,专用芯片与电路可能无法拯救整个计算机行业。
时至今日,加速器早已无处不在:世界上的比特币大多由用于加速加密货币核心算法的芯片采矿得来,几乎每一种能够发出声音的数字产品都在使用硬连线音频解码器;而且当前亦有数十家初创企业在探索速度更快的专用芯片,旨在真正推动深度学习AI实现普及。这种专用化趋势,使得各类原本运行在通用CPU之上的软件及其内部常见算法得以在定制化硬件上带来更快的处理速度。但必须承认,从悲观角度来讲,这也是摩尔定律失效之后,我们能够在接下来一到两代芯片当中继续驱动计算能力保持增长的少数可行方法之一。
但更遗憾的是,这种过渡性方案也即将走向终点——至少将有不久的将来耗尽一切潜能空间。普林斯顿大学电气工程学副教授David Wentzlaff和他的博士生Adi Fuchs即将在本月IEEE国际高性能计算机架构研讨会上就这一研究方向提出重要结论。根据他们计算出的结果,芯片专用化无法带来与摩尔定律相契合的性能收益。换句话说,加速器的发展即将向已经开始萎缩的晶体管那样走向尽头,而且这一切的来临都要远早于人们的预期。
为了证明他们的观点,Fuchs与Wentzlaff首先需要弄清楚近期芯片中表现出的性能提升之内,有多大比例来自芯片专用化调整,又有多大比例源自摩尔定律本身。这意味着他们需要检查1000多份芯片数据表,同时弄清这些不同型号处理器中的哪些性能组成部分源自更好的算法,又有哪些由更巧妙的电路实现方法所贡献。更具体地讲,他们希望把这段时间半导体行业内的人类聪明才智进行一番量化统计。
为了实现这一目标,他们采取了工程师最擅长的方法:将问题转换为无量纲量。他们将其称为芯片专用化回归,并希望借此解决这样一个问题:“晶体管的计算能力在晶体管自身的固体物理潜能空间中还有多大的改善余地?”
利用这一指标,他们评估了特定应用集成电路(简称ASIC)上的视频解码性能,在GPU上测试游戏帧率,在FPGA上测试卷积神经网络并在ASIC上尝试比特币采矿。然而,得出的结果令人相当沮丧:专用芯片的增益在很大程度上仍然源自每平方毫米内可用晶体管数量的增加。换句话说,如果没有摩尔定律的支持,芯片专用化本身并不能带来显著的性能提升。
因此,如果专用化无法给出理想的答案,那么未来的出路在哪里?Wentzlaff建议半导体业界学习使用那些能够在逻辑停止时仍可实现扩展的事物进行计算。举例来说,每平方厘米内的可用闪存bit数能够不断增加,这与摩尔定律无关,因为业界已经开始能够制造出256层甚至更高单元层数的3D堆叠技术。Fuchs与Wentzlaff已经开始就这一方向展开探索,他们希望开发出一种新的计算机架构,通过让处理器查找存储在内存当中的原有计算结果(而非重新进行计算)来加快计算速度。
Wentzlaff最后总结道,摩尔定律的终结“并不是世界末日。但很明显,我们仍然需要为此做好准备。”
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。