利用AI技术制造更强大的AI芯片,这个思路有问题吗?
如同鲑鱼总会洄游到先祖繁衍它们的水域一样,英伟达的GPU也兜兜转转又回到了芯片工厂。
台积电、ASML和Synopsys都在使用英伟达加速器来加速或支持计算光刻技术。与此同时,KLA Group、Applied Materials和日立也在英伟达的并行处理芯片上运行深度学习代码,借此进行电子束与光学晶圆检测。

当然,晶圆厂里遍布着各色电子产品,可以说一切芯片都会以某种方式回归原点。但有趣的是,GPU在整个制造流程中一直扮演着加速器的角色。随着我们不断缩小晶体管门,借此将更多晶体管封装到处理器当中,计算光刻已经成为近年来将更小门电路蚀刻上裸片光掩模的必要手段。
就在不久之前,这些工作负载还主要由CPU核心负责运行。但事实证明,只要进行适当调整,GPU才是真正擅长这类加速任务的理想选手。
对于计算光刻这类场景,调整过程并不复杂。大多数芯片是通过光掩模投射特定波长的光(通常是光谱中的极紫外部分)以实现芯片蚀刻。为了在硅芯片上生产出越来越小的晶体管,工程师们必须发挥自己的创造力和想象力,在缩小电路尺寸的同时防止因特征模糊而造成的图案失真。如今生产中使用的光掩模堪称华丽,往往是大规模计算集群运行数周所产出的结果。
利用GPU加速,英伟达公司CEO黄仁勋表示有望将整个过程提速50倍。“几百套DGX系统就有望取代数以万计的CPU服务器,从而将功率和成本拉低一个数量级。”
关注科技动态的朋友想象都清楚,如今的图形处理器不仅是高性能计算的基础,更是大规模AI高度依赖的动力中枢。虽然英伟达在今年3月公布cuLitho软件栈时并未提及人工智能,但公司高级技术部门副总裁Vivek Singh已经明确表示,AI在计算光刻中的广泛应用只是时间问题。
在上周二的ITF半导体大会上,英伟达掌门人黄仁勋再次强调AI有望为摩尔定律注入新的活力。他坚称“芯片制造行业,正是英伟达加速和AI计算的理想应用场景。”
虽然目前的晶圆代工厂已经高度自动化,但英伟达还是从中发现了机会,能够将其在机器人技术、自动驾驶汽车和聊天机器人方面获得的成果引入芯片制造,并通过向处理器设计师、设备供应商和代工厂销售GPU豪赚巨额财富。
在演讲当中,黄仁勋还提到VIMA——一种多模态的“预训练AI模型,能够根据视频文本提示执行任务,例如重新排列物体以匹配当前场景。”
黄仁勋没有明确提到这项技术会被纳入芯片设计软件,但从大会主题对于半导体制造的高度关注,走上这个方向也基本成为定局。“我期待物理AI机器人技术和基于Omniverse的数字孪生技术,能够共同推动芯片制造开启更加光明的未来。”
英伟达想要在半导体行业推销加速计算产品,完全是顺应时势的合理决策。
随着消费级GPU市场的崩溃和加密货币逐步走入寒冬,英伟达的数据中心部门替公司扛下了大量“伤害”。由于业务表现平平,黄仁勋上季度甚至决定降薪自救。
尽管近期芯片需求、特别是高端芯片需求有所下滑,但三星、台积电、英特尔、SK海力士等代工厂商正在推进新的代工项目。这方面业务扩张很大程度上由美国、欧洲和亚太地区的一系列措施所推动,总计为半导体行业带来超1000亿美元的税收减免和补贴。英伟达的行业龙头地位,也使其拿到了相当一部分芯片增产收益。
至于AI技术的迅猛发展,虽然它潜在威胁到不少白领员工的生计,但同时也有助于解决半导体领域技术工人短缺的老大难问题。
去年初,安全与新兴技术中心就曾发出警告,称美国半导体制造业的“回流”举措可能因缺乏熟练工人而受阻。据估计,美国需要培训、雇用或引进2.7万名员工才能填补缺口。
台积电创始人张忠谋多次指出,与台湾相比,美国的半导体制造成本会高出很大一块。
为了填补空白并成功控制成本,芯片制造商正全面引入AI/机器学习以提升代工和设计流程的自动化水平。也许AI技术在某人类的命之前,将先革一波自己运行所在芯片的命。
好文章,需要你的鼓励
B&H近期对多款M5 Pro MacBook Pro机型推出300美元优惠。14英寸M5 Pro版本(48GB内存+1TB固态硬盘)现售价2299美元,较原价2599美元节省300美元,且该配置在亚马逊无法购买,折扣机会更为难得。此外,16英寸M5 Pro版本(64GB内存+1TB固态硬盘)同样享有300美元折扣。B&H在多款高配MacBook机型上的定价已低于亚马逊,是近期可找到的最优价格。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
Insta360推出GO 3S复古套装,将现代4K运动相机与胶片时代美学结合。套装核心仍是仅重39克的GO 3S,新增复古取景器、胶片风格滤镜、NFC定制外壳及可延长录制时长至76分钟的电池组。复古取景器模仿老式腰平相机设计,鼓励用户放慢节奏、专注构图。相机内置11种色彩预设及负片、正片等滤镜,同时保留FlowState防抖、4K拍摄及10米防水能力,面向热衷复古影像风格的年轻创作者。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。