
图:rawpixel/freepik
惠普企业有限公司(HPE)进一步扩展旗舰产品HPE GreenLake系列,日前推出支持生成式人工智能的GreenLake大型语言模型(LLMs)。
HPE表示,业界企业现在可以利用多租户超级计算云服务按需使用LLM及进行可持续的超级计算平台训练、微调和人工智能模型的部署。
HPE在美国拉斯维加斯举行的HPE Discover大会上宣布推出HPE GreenLake大型语言模型。 HPE与德国人工智能初创公司Aleph Alpha GmbH合作交付GreenLake大型语言模型。GreenLake大型语言模型为用户提供训练好的LLM,可用于需要文本和图像处理及分析的用例。据称,GreenLake大型语言模型是HPE计划推出的一系列行业和特定领域人工智能应用中的第一个产品。其他的一些应用将会支持诸如气候建模、医疗保健和生命科学、金融服务、制造和运输等用例。
HPE表示,GreenLake大型语言模型在HPE Cray XD超级计算机上运行。这意味着客户将不需要自己支付或租用这些资源。HPE Cray XD提供人工智能原生架构。人工智能原生架构是专门用于以全计算能力运行单一大规模人工智能训练及模拟工作负载。据HPE称,HPE Cray XD可以支持人工智能和高性能计算工作负载同时在数百甚至数千个中央处理单元和图形处理单元上运行,从而提供训练和创建更准确的人工智能模型所需的基础架构。
客户可以使用名为Luminous的预训练LLM。Luminous由Aleph Alpha开发。客户利用Luminous可以用自己的数据训练和微调定制的人工智能模型。客户利用该服务可以建立各种类型的人工智能应用,并将其整合到自己的业务工作流程中。用户还将获得HPE的机器学习开发环境和机器学习数据管理软件。该软件可提供人工智能模型的快速训练以及整合、训练数据的跟踪和审计等所需的工具。
Aleph Alpha首席执行官Jonas Andrul表示,“我们利用HPE的超级计算机和人工智能软件可以高效、快速地训练出Luminous这个大型语言模型,Luminous可供银行、医院和律师事务所等关键企业作为数字助理使用。我们很荣幸能成为HPE GreenLake大型语言模型的启动合作伙伴。我们将会把Luminous扩展到云端,并会将其以即服务的形式提供给终端客户,推动商业和研究计划新应用的发展。”
Constellation Research Inc.分析师Holger Mueller表示,HPE进入了一个越来越拥挤的领域,众多基础设施供应商都在争相为新一代的生成式人工智能工作负载提供支持。但他表示,HPE也有很大的发展空间,原因是希望建立这种模型的公司对计算资源的需求非常庞大。
Mueller表示,“HPE手里真正的王牌是旗下的Cray超级计算机。Cray拥有处理LLM工作负载的完美架构。HPE也在与多个人工智能合作伙伴进行开放合作,例如Aleph Alpha。HPE对于那些有数据安全意识的欧洲客户可能特别有吸引力。这些客户可以利用HPE GreenLake在云中进行训练,然后在本地进行推理,为公司的ProLiant服务器创造更多的工作负载。”
Mueller的Constellation同事Andy Thurai补充表示,HPE的产品与大型云供应商的产品不同,HPE的产品可能对一些气候建模、医疗保健和生命科学、金融服务、制造和运输等应用和行业有吸引力。他表示,“在这些特定行业建立特定领域平台可以带来价值。这在公共云中是难以做到的。”
他表示,HPE的混合计算方法同样也很独特。他称,“在混合地点训练LLM一直都是个挑战,原因之一是计算能力,另外还需要建立生态系统。HPE提供的超级计算即服务含内置人工智能和LLM模型训练生态系统,希望这可以提供一些帮助。”
Thurai指出,尽管如此,HPE其实是在寻找成熟的AI工作负载,而不是较新的、更具创新性的工作负载。因此,他表示,“工作负载数量和总的可用市场对这些客户来说将是非常有限的。公共云供应商将会找到一个机制防止最初的创新云工作负载迁移出去。”
HPE称HPE GreenLake大型语言模型将按需提供。HPE表示现在已开始接受订单,预计到今年年底将在北美启动并运行,2024年初在欧洲启动。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。