IBM Research称,已经开发出了一种内存计算新方法,可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。
在今天Nature Electronics期刊上发表的一篇论文中,IBM研究人员描述了这种新的“混合精度内存计算”方法。
IBM关注传统计算体系结构的不同看法,在这种体系结构中,软件需要在单独的CPU和RAM单元之间进行数据传输。
据IBM称,这种被称为“冯诺依曼”的体系结构设计,为数据分析和机器学习应用制造了一个瓶颈,这些应用需要在处理单元和内存单元之间进行更大的数据传输。传输数据也是一个耗能的过程。
应对这一挑战,IBM给出的一种方法是模拟相变内存(PCM)芯片,该芯片目前还处于原型阶段,500万个纳米级PCM器件组成500×2000交叉阵列。
PCM的一个关键优势是可以处理大多数密集型数据处理,而无需将数据传输到CPU或GPU,这样以更低的能量开销实现更快速的处理。
IBM的PCM单元将作为CPU加速器,就像微软用于加速Bing和加强机器学习的FPGA芯片一样。
据IBM称,研究表明在某些情况下,其PCM芯片能够以模拟的方式进行操作,执行计算任务,并提供与4位FPGA存储器芯片相当的准确度,但能耗降低了80倍。
模拟PCM硬件并不适合高精度计算。所幸的是,数字型CPU和GPU是适合的,IBM认为混合架构可以实现更高性能、更高效率和更高精度的平衡。
这种设计将大部分处理留给内存,然后将较轻的负载交给CPU进行一系列的精度修正。
根据IBM苏黎世实验室的电气工程师、也是该论文的主要作者Manuel Le Gallo称,这种设计有助于云中的认知计算,有助于释放对高性能计算机的访问。
Le Gallo表示:“凭借我们现在的精确度,我们可以将能耗降低到是使用高精度GPU和CPU的1/6。”
“所以我们的想法是,为了应对模拟计算中的不精确性,我们将其与标准处理器结合起来。我们要做的是将大量计算任务转移到PCM中,但同时得到最终的结果是精确的。”
这种技术更适合于如数字图像识别等应用,其中误解少数像素并不会妨碍整体识别,此外还有一些医疗应用。
“你可以用低精度完成大量计算——以模拟的方式,PCM会非常节能——然后使用传统处理器来提高精度。”
对于只有1兆字节大小的IBM原型内存芯片,现在还处于初期阶段。为了适用于现代数据中心的规模化应用,它需要达到千兆字节的内存量级,分布在数万亿个PCM中。
尽管如此,IBM认为可以通过构建更大规模的PCM设备或使其中PCM并行运行来实现这一目标。
好文章,需要你的鼓励
到 2025 年,人工智能将在生命科学行业带来重大变革。从智能搜索到无缝医疗服务,AI 将优化医疗专业人员和患者的体验。文章预测了 AI 在监管、安全、搜索、个性化服务等方面的具体应用,以及行业技术格局的变化。这些创新将为患者和医疗专业人员带来更高效、更有针对性的服务。
TenneT 携手诺基亚在北海部署光纤网络,连接海上风电场,助力可再生能源增产。该项目将采用先进光网络技术,支持远程监控和管理,确保可靠的能源传输。这一创新模式有望推动欧洲能源转型,为实现 2050 年气候中和目标做出重要贡献。
新加坡物流公司ST Logistics与联想合作,通过新的仓库执行系统和AI算法自动化关键流程。该系统优化货物移动,自动规划最快捷安全的运输路线,加快订单处理。联想的高性能计算系统和AI算法还将优化货物存储,提高即时发货物品的可访问性。这一合作旨在提升供应链效率,增强新加坡在区域竞争力。
研究机构 Coldago 针对不同文件存储应用场景,发布了三份独立的供应商评估报告。报告采用四象限图形式,将供应商分为企业级文件存储、高性能文件存储和云文件存储三类。这种分类方法与 GigaOm 的圆形四象限雷达图有所不同,体现了两家分析机构对文件存储市场的不同见解。