IBM宣布推出装有最新设计的POWER9处理器的新一代Power Systems服务器。全新POWER9系统专为计算密集型人工智能工作负载而设计,可将深度学习框架的训练时间缩短近4倍 ,从而帮助企业以更快的速度更准确地部署人工智能应用。
基于全新POWER9的AC922 Power Systems是首批嵌入PCI-Express 4.0、新一代NVIDIA NVLink及OpenCAPI的系统,这几项技术的结合使其能够加速数据传送,在计算速度方面超出基于PCI-E 3.0的x86系统9.5倍。
该系统旨在大幅提升Chainer、TensorFlow及Caffe等各大人工智能框架的性能,并加速Kinetica等数据库。
如此一来,数据科学家能够以更快的速度构建包括科研范畴的深度学习洞察、实时欺诈检测和信用风险分析等范围的应用。
POWER9是美国能源部Summit及Sierra超级计算机的核心,这两台超级计算机建成后将成为世界上性能最强的数据密集型超级计算机。此外,谷歌公司也采用了POWER9处理器。
谷歌公司平台部副总裁Bart Sano表示:“对于IBM在开发最新POWER技术方面的进展,谷歌感到非常兴奋。POWER9的OpenCAPI总线及其大存储容量为Google数据中心的创新提供了更多的机会。”
IBM认知系统部高级副总裁Bob Picciano表示:“我们已经构建出一个改变人工智能和认知工作负载游戏规则的强大阵容。除了将用于世界上最强大的超级计算机外,IBM POWER9系统还将帮助全球各个行业的各类企业获得前所未有的洞察能力,促进科学的发现,从而实现业务成功转型。”
深度学习是一种机器学习方法,目前正在快速发展。通过数百万次计算及大量的数据分析来提取和排序信息,可以甄别与排列数据最为重要的方面。
为了满足这些日益增长的行业需求,IBM于四年前开始着手设计POWER9芯片,构建一套全新架构,用于管理自由流动的数据、流传感器,以及基于Linux操作系统的数据密集型人工智能和深度学习算法。
IBM是业界唯一一家能够为企业提供融合了尖端硬件及基于最新开源技术创新软件的基础架构厂商。
借助于PowerAI,IBM通过Power架构上的加速技术实现优化并简化了深度学习框架和库的部署,以支持数据科学家在几分钟内便开展工作。
IBM研究院正在为Power架构开发大量技术。通过PowerAI分布式深度学习工具包(PowerAI Distributed Deep Learning toolkit),IBM研究人员现已将深度学习所需时间从数天缩短到数小时。
人工智能时代不仅仅需要强大的处理能力和前所未有的速度,还需要创新型公司所构建的开放式生态系统提供技术和工具。IBM作为推动创新蓬勃发展的催化剂,为300多家来自OpenPOWER基金会及OpenCAPI联盟的成员所组成的开放且发展迅猛的社区提供强大动力。
好文章,需要你的鼓励
科技泡沫并非世界末日,从经济角度看,泡沫是押注过大导致供过于求。AI泡沫问题复杂在于AI软件开发节奏与数据中心建设周期的时间错配。甲骨文关联数据中心获180亿美元信贷,Meta承诺三年内投入6000亿美元基础设施。麦肯锡调查显示企业虽广泛使用AI但规模有限,多数仍持观望态度。微软CEO表示更担心数据中心空间不足而非芯片短缺,电力需求成为新瓶颈。
Salesforce AI研究团队构建了首个大规模多模态文档RAG评测基准UniDoc-Bench,包含7万页真实PDF文档和1600个问答对,覆盖8个领域。研究发现文本图像融合检索策略显著优于单一模态和联合多模态方法,为未来AI文档理解系统提供了"分工合作"的设计思路。
Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。
腾讯研究团队发现AI训练中"推理火花"现象,揭示低概率词汇如"等等"、"不过"等在维持AI探索能力中的关键作用。团队开发的低概率正则化方法通过精准保护有价值的低概率词汇,在数学推理任务中实现60.17%准确率,比传统方法提升2.66%,为AI创造性思维研究开辟新路径。