一周前,IBM在Think 2018上做了 一系列人工智能相关的公告,现在HPE也紧随其后想要抓住人工智能这个IT业界最热门的趋势。
HPE今天宣布推出旨在帮助客户加快机器和深度学习的硬件、垂直市场软件和培训服务。
硬件部分是HPE Apollo 6500 Gen10,据称这是专为深度学习而设计的高性能计算系统,比之前几代在模型训练速度方面快了3倍。
模型训练是机器学习过程中的一个关键部分,创建一个针对算法的行动计划,用于分析大量的数据。深度学习是机器学习的一种,是试图模仿人类大脑的功能。该系统与IBM最近推出的基于最新Power9处理器的系统有些类似。
该系统配备了Intel Xeon Scalable处理器,主频为3GHz,最多28个核心,每台服务器8个GPU,每秒可为单精度计算任务提供高达125万亿次浮点运算。它配备了PCIe背板或Nvidia的NVLink 2互连,用于GPU与GPU之间的高速通信。
HPE表示,高带宽、低延迟网络适配器与GPU加速器紧密耦合,最大限度利用带宽。每个系统最多支持3 TB内存和16个SAS或者SATA SSD,其中四个可以是NVMe驱动器。 HPE在声明中表示:“HPE Apollo 6500 Gen10系统最适合于解决深度学习模型训练中最重要的步骤。”
HPE Digital Prescriptive Maintenance被HPE成为首个人工智能优化的行业解决方案。它通过预测性维护自动预防问题的发生,从而延长工业设备的使用寿命,同时减少停机时间。HPE表示:“预测性维护检测工业设备何时可能出现故障,规定性维护预测、建议并自动采取正确的行动,在问题导致故障发生之前解决问题。”
该套件结合了来自HPE PointNext服务部门的教育和实施服务,以及来自HPE及其合作伙伴的机器学习和数据分析软件,运行在基于 HPE硬件的、以物联网为驱动的数据湖上。该服务包括实时和批量数据、机器学习、基于分析的异常检测、设备发生故障时的数据保护、指导维护步骤和自动化工作流程,无论是在网络边缘还是在网络中心。
最后,HPE Artificial Intelligence Transformation Workshop是一个针对商业领导者的、针对与公司业务相匹配的用例的人工智能全新定制介绍。HPE表示,参与者将“发现需要关注的领域,并制订一个高层次的计划,其中考虑了与你需求相关的机会、障碍和关键成功因素”。该计划还包括如何从实验转向生产方面的建议。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。