NVIDIA BlueField DPU和 HDR InfiniBand,助力剑桥大学的安全多租户超级计算机获得突破性的性能与安全。
超级计算所赋能的科学研究可能会改变整个世界,造福于科学、产业和社会。剑桥大学的全新开放式云原生超级计算机拥有着顶尖的性能,将助力研究人员开展前所未有的科学探索。
加利福尼亚州圣克拉拉市 – 2021年4月14日 – 据NVIDIA消息,CSD3(Cambridge Service for Data Driven Discovery)是一台英国国家研究云项目的超级计算机,同时也是全球性能最强大的科研超级计算机之一。它获得了由STFC DiRAC、STFC IRIS、EPSRC、MRC和UKAEA支持的英国研究与创新中心(UKRI)资助,并委托剑桥大学进行管理。
这里同时也是英国最大的科研云基地,目前正在扩容一个算力达4PFlops的全新Dell-EMC系统,该系统采用NVIDIA A100 GPU,NVIDIA BlueField DPU和NVIDIA InfiniBand网络,将为英国学术研究机构在广阔的交叉研究上提供安全的、多租户、裸金属高性能计算AI和数据分析服务。CSD3采用了由NVIDIA赋能的全新云原生超级计算平台以及由剑桥大学和StackHPC共同开发的一款名为“Scientific OpenStack”的革命性云HPC软件栈。
预计CSD3新系统部署后,性能可达4PFlops,并跻身世界超级计算机500强。该系统采用NVIDIA GPU和x86 CPU,与其他部分一起,整体系统可提供超过10 PFlops的综合算力,并且包含英国速度最快的基于Dell/Cambridge数据加速器的固态存储阵列。
CSD3为研究人员提供开放、安全的访问,以助力其在天体物理学、核聚变发电技术开发、以及关乎生命的临床医学应用等领域,解决全球共同面临的最具挑战性的问题。它将运用融合仿真、AI和数据分析应用,推进科学探索,使研究人员可以在不牺牲应用性能或工作效率的情况下,更方便、安全地访问。
NVIDIA DPU和HDR InfiniBand赋能新一代系统
CSD3采用了NVIDIA HDR 200G InfiniBand网络将BlueField-2 DPU连在一起来卸载主机的安全策略和存储框架等基础设施管理应用,同时提供工作负载的加速和隔离,最大程度提高输入/输出性能。
剑桥大学研究计算服务总监Paul Calleja表示:“能够简单、安全地访问CSD3的巨大算力对于推动服务于英国科学界和工业界的新一代科学探索而言至关重要。凭借NVIDIA InfiniBand网络的极致性能、BlueField DPU提供的应用卸载、隔离和加速,再加上我们的“Scientific OpenStack”,剑桥大学能够打造出一台推动科学研究、造福全人类的世界级云原生超级计算机。”
NVIDIA HDR InfiniBand的网络计算引擎进一步加速了网络性能,在提供最佳裸金属性能的同时,为多节点租户隔离提供了原生支持。CSD3应用了最新一代Dell-EMC PowerEdge产品系列的优势,采用针对数据密集型和AI应用进行了优化的Dell EMC PowerEdge C6520和PowerEdge XE8545服务器。
预计CSD3将在今年投入使用。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。