HPE正在调整自己的AI产品组合,近日宣布推出了一套新的混合云产品,用于机器学习开发、数据分析、AI优化的文件存储以及推理服务的调优。
HPE表示,这些服务将通过一个平台提供,该平台结合了开源软件和基础设施,专为AI模型训练的数据需求而设计。
HPE计算部门总经理Neil MacDonald表示:“企业可以接受和探索的速度,以及他们对如何对部分业务运营进行转型的实验,是至关重要的。我们正在提供一种开箱即用的推理解决方案,使客户能够采用预先训练好的模型并将其部署到环境中以转型他们的企业运营,并且能够比以前更快速地完成这一任务。”
超级计算的优势
HPE表示将利用GreenLake平台提供以AI为中心的功能组合,包括数据优先管道、生命周期管理软件、高性能互连、以及对第三方扩展的开放生态系统的支持。HPE表示,通过2019年收购Cray Research所获得的超级计算专业知识,将让HPE在这个市场中占据优势。
HPE公司人工智能首席产品官Evan Sparks表示:“你的DNA中需要具备超级计算能力,并且能够扩展到大规模计算中,HPE已经在许多其他领域解决了这些问题。
HPE在本周举行的Discover Barcelona大会上宣布与Nvidia扩大合作,提供由Nvidia构建的生成式AI专用计算平台,该平台将针对那些使用私有数据集和自定义软件工具的AI模型的训练和调整进行优化。
该平台基于HPE ProLiant DL380a硬件,预配置了Nvidia L40S GPU、BlueField-3数据处理单元和Spectrum-X以太网网络,其规模可调优一个配置16台服务器、64个GPU以及具有700亿个参数的Llama-2模型。它将配备增强型HPE Machine Learning Development Environment,具有用于原型设计和测试的生成式AI工作室功能,以及具有GPU感知功能的HPE Ezmeral软件。
此外还包括了Nvidia的企业运输局软件堆栈,用于安全且可管理的AI开发和部署,以及用于模型定制和部署的Nvidia NeMo云原生框架。
新型应用
Nvidia公司企业计算副总裁Manuvir Das表示:“生成式AI催生了一种新型的企业应用,这种应用使用AI嵌入模型将数据仓库中的数据转换为嵌入,这是信息含义的一种表示。然后,你使用矢量数据库来存储这些嵌入,以便可以与数据进行对话,找到库中最能代表答案的所有信息,并将其转化为提示内容以提供给大型语言模型。”
以AI为中心的基础设施将包括用于文件存储的GreenLake,这是一个针对模型训练和调整进行微调的全闪存非结构化数据平台。该平台的性能密度是现有GreenLake文件存储的2倍,吞吐量和与Nvidia Quantum-2 InfiniBand网络平台的连接性是现有GreenLake文件存储的4倍。
HPE Machine Learning Development Environment现在也已经作为一项管理服务用语模型训练了。HPE表示,该服务降低了模型开发的操作复杂性和人员需求,并具有用于原型设计和测试的生成式AI专有工作室功能。
用于软件容器的HPE Ezmeral平台得到了增强,现在支持针对GPU优化的混合数据湖仓,并支持NFS文件系统以及AWS S3兼容的对象存储。此外,Machine Learning Development Environment集成了分析软件,能够提供增强的模型训练和调整功能。
HPE Ezmeral软件总经理Mohan Rajagopalan表示:“我们正在努力打造单一的管理平台体验,以最大限度地利用和管理你的数据,无论这些数据位于何处。”
这款增强的产品针对跨工作负载的Nvidia GPU分配进行了优化,并提供了对第三方集成的访问,包括用于数据记录的开源Whylogs以及用于GPU加速查询的Voltron Data框架。
HPE还表示,HPE的服务部门将提供广泛的咨询、培训和部署服务,并由位于西班牙、美国、保加利亚、印度和突尼斯的人工智能和数据中心提供支持。从明年第一季度客户可以开始订购这些生成式AI产品和服务。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。