随着工业电子信息产业的发展,高性能计算已经逐步由单机处理逐渐发展至集群化,很多企业存在自建高性能计算集群的需求。但在实际生产及使用方面,仍存在诸多方面的问题,例如集群搭建和维护工作繁重,需要投入很多物力和人力,使企业无法全力聚焦在主要业务上。另外,或硬件设备更新迭代速度快,计算量快速膨胀,新技术层出不穷,初期规划无法适应新的业务需求。因此,充分借用云端的集群管理能力,成为越来越多客户的高性价比选择。
针对科学计算、基因工程、气象电力、生物医药、工程制造等高算力场景, 近期,UCloud推出了全新升级的高性能计算集群,并新增独占集群管理功能,为高算力业务场景下的客户提供便捷高效的集群管理服务。
针对用户需求,支持独占集群与共享集群
EPC高性能计算集群集成UCloud的计算、存储、网络等资源,为客户提供便捷管理、可弹性伸缩的高性能计算服务。目前EPC分为独占集群和共享集群两种形态:
独占集群为客户创建的私有集群,客户可独占集群内的所有算力资源,自定义集群内部运行环境,自主安装系统应用。也是本次产品升级的重点,下面会详细介绍一下。同时提供可多点挂载的共享存储,同项目下的所有计算节点共享存储空间,在满足客户多节点共享数据的需求外,也一定程度上减低客户的存储成本,做到真正的降本增效。
共享集群则为所有用户共享的算力的计算集群,客户无需关注资源的调度和管理,仅根据自身需求,提交计算任务即可。
独占集群
独占集群模式下,UCloud提供两种资源部署方式,一种是集群部署,一种是节点组。在集群部署模式下,UCloud为客户提供作业调度软件的自动化部署功能,客户仅需要根据自身的实际业务需要来选择计算资源配置,磁盘以及网络资源,系统即可为客户一键创建高性能计算集群。
客户可以通过登录节点提交和分配计算任务,在计算节点执行计算任务。产品架构如下图所示:
在节点组部署模式下,UCloud为客户提供批量创建计算节点的能力,用户可一次性选择创建单台或者多台计算节点,同步配置磁盘、网络,提供部分科研场景下的常用软件,无需关注基础的环境搭建,开机即可运算,科研效率大大提升。
共享存储
EPC高性能集群提供了支持多点挂载的共享存储,同项目下的所有节点资源均可挂载在同一块共享存储上,可极大满足客户多计算节点共享数据源的需求。
当客户创建集群或者计算节点时,节点自动挂载共享存储,支持在线扩容,满足客户数据弹性存储需求。同时提供FTP文件上传下载功能,外网带宽最高可达100M。同时,EPC共享存储支持SMB协议和NFS协议,可满足不同客户Windows和Linux系统的使用需求。
提升科研算力,具备五项优势
资源丰富,弹性扩容
依托于UCloud公有云海量计算资源,可满足客户业务高峰时大量资源需求。
灵活部署
支持多种实例规格,满足科学计算、基因测序、建模仿真等多种应用类别。
提供资源管理、作业调度服务
提供自动化部署slurm调度器的能力,一键部署集群,支持集群任务调度。
支持共享存储
提供支持多点挂载的共享集群,创建时自动挂载。
计费方式灵活
支持包年包月、小时计费多种计费方式,客户按需使用计算资源服务,在满足业务需求同时,有效节约成本。
EPC助力多领域科研场景降本增效
生物信息领域
生物信息领域涵盖基因测序、基因分型、精准医学、个性化治疗等多种研究领域。上海某大学课题组在使用冷冻电镜技术对病毒蛋白质样本成像和重建实验中,利用UCloud EPC服务,通过RELION软件的GPU加速功能,加速病毒蛋白质的三维结构的重建(对几十万张2D或3D投影图片进行分析、组装和优化)。
分子模拟领域
分子模拟领域研究光谱预测、电子密度分布等物质表征模拟需求,也支持蛋白质-药物配体动力学、近场动力学、碳纳米管束等计算高度密集的科学问题。浙江某大学采用UCloud EPC服务,使用Gromacs软件对膳食卵清蛋白与叶酸的相互作用机理进行了研究,大幅提升研究效率。
人工智能领域
人工智能涵盖深度学习和强化学习,通过算法模型训练,应用于计算机视觉、自然语言处理、推荐引擎等场景。安徽某学院借助UCloud EPC服务,研究基于PyTorch的深度学习模型,进行心电公共数据端到端的分类,整体模型训练的效率得到极大的提升。
好文章,需要你的鼓励
YouTube开始推出肖像检测工具,帮助创作者识别和举报使用其面部特征的AI生成视频。该系统类似于版权检测机制,目前处于测试阶段,仅向部分创作者开放。用户需要提供政府身份证件照片和面部视频来验证身份。系统会标记疑似包含用户肖像的视频,但无法保证100%准确识别AI内容。YouTube将根据多项因素决定是否移除举报的视频。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。
谷歌宣布在AI Studio平台中引入"氛围编程"体验,让编程和非编程用户都能更轻松地开发应用程序。用户可通过简单提示生成可运行的应用,新功能包括应用画廊、模型选择器、安全变量存储等。平台还添加了模块化"超能力"功能和"手气不错"按钮来激发创意。完成的原型应用可一键部署到谷歌云运行平台。此次更新正值业界期待谷歌即将发布Gemini 3.0大语言模型。
中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。