作者:MARIA DEUTSCHER
更新时间:美国东部时间2023年10月20日17:32
IBM今天推出了NorthPole,这是一种内部设计的人工智能芯片,据称该芯片的能效明显高于竞品处理器。

NorthPole由IBM位于加利福尼亚州阿尔马登的研究实验室的工作人员历时八年开发而成。该芯片建立在IBM早期的一个研究项目之上,那个项目开发了一款名为TrueNorth的AI优化处理器。据IBM称,NorthPole的速度大约快4000倍。
这款新推出的芯片由220亿个使用12纳米工艺制造的晶体管组成。IBM表示,这些晶体管被组织成256个内核,每个内核在每个时钟周期内可以以8位精度执行2048次计算。这意味着计算是在相对较小的数字上进行的,这些数字最多占用八位空间。
NorthPole的256个内核中的每一个都包含一个集成的内存池,用于存储计算中使用的信息。由于芯片的存储电路和内核彼此靠近,数据可以在短时间内在两者之间传输。这减少了与数据移动相关的处理延迟,从而提高了性能。
IBM大脑启发计算首席科学家Dharmendra Modha表示:“从架构上讲,NorthPole模糊了计算和内存之间的边界。”“在单个内核级别,NorthPole 表现为内存靠近计算;从芯片外部看,在输入输出级别,它表现为活动内存。”
NorthPole核心内置存储电路的另一个好处是这种做法提高了能效。在芯片的不同部分之间移动数据不仅会延迟处理,还会消耗电力。NorthPole的架构将数据在存储器电路和内核之间必须传输的距离最小化,用这种方法节省了能耗。
IBM使用了名为ResNet-50的开源图像识别模型来测量这款芯片的功耗。该模型通常被用于比较不同AI处理器的功能。据IBM表示,NorthPole运行ResNet-50的能效分别比基于12纳米和14纳米节点的显卡和中央处理器高25倍。
NorthPole的能效受到以下事实的限制:它也使用12纳米节点制造,这比芯片制造商可以使用的、最先进的3纳米工艺落后了好几代。但是,该处理器可以升级到更新的制造技术。据报道,IBM的研究人员估计,这样的升级可以使NorthPole提供比基于“当前设计”的竞品芯片高25倍的能源效率。
处理器的功耗直接影响其产生的热量。IBM表示,NorthPole的能源效率限制了其最高温度,这意味着该芯片只需要简单的外部冷却设备即可运行。因此,它或许可以部署在空间受限的系统中,例如冷却装置空间有限的自动驾驶汽车。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。