HPE Greenlake
2019年,Hewlett Packard Enterprise曾矢志在2022年之前将旗下所有产品转化为“即服务”形式。在这项战略当中,HPE的GreenLake云服务产品组合无疑是最重要的组成部分之一。就在上周,HPE方面终于为这套旨在为企业客户提供高灵活度、可扩展且安全的IT体系全面组织与监控解决方案引入新成员。随着高性能计算(HPC)产品的的推出,GreenLake产品线将逐步为主流企业带来更加轻松易行的HPC服务。下面具体来看。
降低HPC准入门槛
近年来,高性能计算的迅猛发展为研究人员、工程师以及企业自身带来了广阔的发展空间。借助这些系统提供的强大算力,组织得以开发模型、运行模拟并从业务数据存储库中提取洞见——考虑到巨大的数据体量及分析复杂度,这一切在以往根本无法想象。此外,高性能计算系统在AI与自动化等下一代技术领域同样表现出色,帮助更多企业乘上AI与自动化的发展浪潮。如今,从协助疫苗研发、到家居消费品、再到设计更为安全的自动驾驶汽车,几乎一切业务都能受益于HPC的有力支持。这些系统能够运行模拟,进而预测库存趋势、加速并提高石油与天然气勘探工作的安全性等等。坐拥这一潜力,预计到2024年,全球HPC市场总值将增长超过40%(根据Intersect360 Research的研究结果)。
但在HPC广泛进入企业领域之前,首先需要解决的难题在于:这些强大的计算机系统成本高昂、架构复杂且极耗资源。普通企业往往没有充足的时间、金钱或人员专门负责这些HPC系统的部署与管理。
在这方面,HPE GreenLake通过按需付费、可扩展、完全托管的服务形式交付HPC算力,借此以革命性的方式加快HPC在主流企业群体中的部署速度。HPE方面指出,这将使HPC项目的部署速度提升达75%,同时将成本缩减至40%。这些改进,相当于是把这种足以改变行业游戏规则的技术真正交付至普通企业手中。
更多详情
首先,HPE GreenLake以自家Apollo系统为基础提供HPC服务,未来还将逐步引入更多HPE元素(包括Cray系统)以构建起不断增强的HPC产品组合。目前发布的第一套方案主要利用HPE的网络与存储技术,专门针对建模及仿真工作负载所构建。此外,其中还包含HPC工作负载管理软件、HPC集群管理与监管功能,并支持特定于HPC的容器及业务流程。
客户还将由此获得GreenLake的其他重要服务,包括用于管理及优化客户HPC服务的HPE GreenLake Central平台;可为客户提供GreenLake使用指标及成本实时视图的Consumption Analytics;供客户通过简单点击对HPC集群进行部署及管理、且不会造成工作流中断的自助服务仪表板;最后是HPC、AI与App服务,这些服务用于对HPC工作负载进行标准化并将其打包在容器之内。这最后一项功能旨在简化数据的现代化、传输与访问流程,帮助企业客户顺利推进自身数字化转型计划。
此项新服务将于明年春季以三种不同配置形式(小型、中型与大型)面向公众开放。HPE方面表示,客户在订购之后将于14天内收到捆绑包,并很快得以启动并全面管理属于自己的HPC服务。
广泛的生态系统支持
对于一切新兴技术,HPE的GreenLake Cloud Services for HPC都拥有众多合作伙伴的有力支持。如果企业客户缺乏充足的物理空间以容纳HPC系统及设备,您可以选择将其部署在HPE主机代管合作伙伴所运营的低功耗、高可扩展数据中心之内。以此为基础,客户可以通过GreenLake远程访问其HPC服务。这套解决方案特别适用于那些不需要本地数据中心,或者不愿分神打理数据中心物理基础设施的企业。
此外,HPE还拥有一系列独立软件供应商(ISV)合作伙伴,包括Activeeon、Core Scientific以及TheUberCloud等,他们负责为广泛的潜在HPC应用场景提供软件方案——具体涵盖AI、自动化、分析以及计算机辅助设计(CAD)等等。
总结
对于一切有意愿尝试HPC、但又担心为此支付过高成本的企业来说,HPE的最新公告都代表着可喜的新方向。不同规模的企业都能够从HPC的解决方案中获益,由此摆脱传统上种种令人头痛的部署及运营负担。也正因为如此,即服务模式才在近年来的市场之上受到广泛关注——通过将IT事务外包给第三方,企业将得以保留宝贵资源及人力以专注于更具战略意义的业务目标。总而言之,相信HPE GreenLakd在高性能计算领域做出的探索有助于推动HPC技术的大众化,特别是有助于加快HPC在企业应用领域的广泛普及。未来可期,我们将持续关注HPE在高性能基础设施以及HPC专用数据管理工具市场上的发展动态。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。