提起高性能计算(HPC)往往会让人联想到模拟原子核裂变、天空大气变化等高科技应用领域,自然也会为HPC披上一层神秘的面纱,但HPC并不神秘,甚至已经步入了人们数字化的业务与生活之中。下面就由Supermicro 电脑股份有限公司北京公司总经理、中国区高级销售总监李运杰先生向我们解密,HPC在数字化转型中的定位。
Supermicro 电脑股份有限公司北京公司总经理、中国区高级销售总监李运杰
高性能构建稳健算力平台
高性能计算和人工智能的兴起触发了众多行业的根本性转变。企业可以利用这些功能提高自己的生产率和业务效率,同时加速获取洞察力以解决各项重大的挑战,最终推动其运营的改善。高性能计算和人工智能成为了诸多应用的基础,包括建模和仿真、基因组测序、实时/预测性分析、自动驾驶和气候监测。尽管人工智能和高性能计算有时被视为不同种类的技术,但是人工智能正在进入高性能计算模拟领域,催生出许多全新的、更加快速的解决方案。
各行各业开始认识到,必须通过先进的技术来支持广泛的高性能计算和人工智能应用,因此,新一代加速计算应运而生,旨在为这些全新的工作负载提供前所未有的性能。专门针对高性能计算和人工智能构建的各种解决方案正在重新定义现代企业。在GPU大规模并行处理能力的支持下,企业可以增强他们创新、工作、协同和解决问题的方式。而企业在向数字化方向进行转型时,首先需要考虑的是要如何搭建一个稳健的数字化平台,来满足企业借助自身和行业的数据来获取深度的洞察力,设计更好的产品,从而改进流程和实现更好的效果。
因此,李运杰先生为我们总结出了HPC产品搭建企业数字化平台的技术优势:
加快数据移动——更高的带宽有助于移动海量的数据;
优化工作负载——迅速适应不断增长的工作负载规模、范围和复杂性;
大规模性能——高吞吐量和低时延可确保最高水平的效率;
技术标准化——集中式框架可简化IT和节约成本。
对于如今的组织来说,执行任务才是他们关注的重点。数据分析、高性能计算(HPC)、人工智能(AI)、机器学习和深度学习工作负载需要的大规模算力和高度灵活性,很快就超过了传统基础设施的能力范围。为了取得成功,企业必须不断对新一代的技术进行投入,以获得革命性的性能和极致的速度。然而对于大部分传统企业而言,往往会缺乏相关的技术能力。在这种情况下,采用成熟的HPC技术来实现算力平台的搭建会是一种更好的选择。
随着高性能计算和人工智能的要求不断提高,Supermicro致力于帮助企业改造其运营环境。Supermicro的加速计算解决方案对密度和性能进行了适当平衡,以管理各种各样的工作负载,同时缩短获取洞察力所需的时间并降低总体拥有成本(TCO)。
HPC助力行业实现算力整合
随着高性能计算和人工智能越来越紧密地交织在一起,企业将不断以新的方式利用自己的数据。传统基础设施是数据密集型应用的最大障碍。为了克服这一痛点,企业必须采用最新的技术进步来满足不断增长的计算需求。新的性能水平将帮助企业能够运行更多的模拟,或使用更精确的模型。于是,创新型组织开始通过GPU加速计算为其运营环境赋能,以充分利用自己的数据,加速媒体处理和计算操作的基础上获取足以改变游戏规则的洞察力。
Supermicro提供一种企业高性能计算参考设计,适用于各种通用的计算密集型工作负载。这种多功能参考架构非常适合设计、数字制造、金融风险管理、医学研究、油气勘探等企业高性能计算用例。
其功能特点如下:
高密度部署
SuperBlade® SBI-420P-1C2N,每个机架最多80个节点;
多达6400个处理器内核(Intel® Xeon®)、320TB DDR4-3200,每个机架160个2.5英寸盘位;
高性能传输
内置InfiniBand HDR和25G交换机模块,减少布线,提升网络、存储传输性能;
高可靠设计
可热插拔节点、交换机模块、PSU和FAN模块,极大增强可靠性及适用性;
高扩展能力
高度可扩展,在非阻塞IB架构中每个集群最多10个机架和800个计算节点。
此外,Supermicro系统(例如:Supermicro SuperBlade®和Supermicro BigTwin®系统)还可针对密度、可扩展性和节能至关重要的高性能计算应用进行了优化,并持续设计最为高效的风冷及液冷系统。
边缘计算让算力贴近业务
数据是在全球市场取得成功的原动力。虽然很多工作负载(包括高性能计算和人工智能应用)可以迁移至大型公共及共享云提供商,但本地高性能计算和人工智能对许多企业来说仍然十分重要。企业内部保留算力既有成本优势,又有响应时间确定、数据安全和新技术采用更加迅速等优点。将性能至关重要的一些工作负载留驻本地,而将性能不那么重要的其他工作负载分配至共享云服务,两者相结合才是最佳实践。另外,在使用预置软件基础设施时,可以更好地把控企业对资源的分配,以降低成本。
随着互联网设备的数量呈指数式增长,本地边缘处理开始变得至关重要,它有助于管理不断生成的海量数据和支持有针对性的创新型应用。组织竭力从越来越多的来源和设备采集、分析和获取情报,因此数据的规模和复杂性暴增。这些工作负载可助力各种应用将数据转化为洞察力和业务价值。
Supermicro可以量身定制高性能计算解决方案,以满足各种各样的工作负载:计算密集型应用、高吞吐量GPU和不同行业使用的大容量存储应用。除此之外,Supermicro还可以根据客户需求,综合运用边缘计算和高性能计算解决方案来管理待处理的海量数据。
与众企业携手 步入高性能未来
随着CPU和GPU不断改进,高性能计算和人工智能应用将继续向前发展。每一代技术的瓦特能效均将逐步提高。此外,除了新的处理器和更高的性能外,每一代技术还必须提供更快的内存和存储I/O。这就需要提前规划一个平衡的系统,以充分发挥CPU内核的潜力。新的内部和外部数据路径也在不断改进,以加快应用的执行速度。执行速度加快后,就能够开展更多的模拟项目,从而推出更加优化的产品,或者更有信心获得良好的模拟效果。总体系统性能提升之后,就可以运行真正的应用,而不只是某个组件。
举例来说,全球最大的能源生产商之一巴西国家石油公司(Petrobras)采用了Supermicro高性能计算解决方案,这个大型集群含有188K内核,在2021年末全球最快计算机系统500强名单中排名第55位。每个计算系统包含768GB内存,并通过InfiniBand EDR网络系统连接,运行速度为100Gb/s。它可以运行广泛的应用程序同时利用许多系统以降低成本和提高勘探精度。
欧洲核子研究组织(CERN)也在利用Supermicro高性能计算集群开展粒子物理学研究。以及NEC正在使用许多Supermicro的GPU服务器进行AI研发。
Supermicro也将通过系统和集群层面的创新,不断扩展其高性能计算市场范围,以涵盖更多的行业。随着高性能计算和人工智能的融合,凭借其全面的 IT 解决方案,能够以更快的速度和更低的成本,向科研机构以及制造、生命科学和能源勘探等不同行业的企业客户,提供包括液冷在内的完整机架级解决方案。
好文章,需要你的鼓励
OpenAI 的 ChatGPT 爬虫存在安全漏洞,可被利用对任意网站发起分布式拒绝服务攻击。攻击者只需向 ChatGPT API 发送一个包含大量重复 URL 的请求,就能触发爬虫对目标网站进行大量访问。此外,该漏洞还可能被用于绕过限制,让爬虫回答查询。这些问题凸显了 AI 系统在安全性方面的潜在风险。
三星即将发布的Galaxy S25 Ultra旗舰手机将带来多项升级,尤其是相机方面。据泄露信息显示,新机将支持高分辨率视频拍摄、超广角微距模式、AI音频擦除等功能,并集成Google Gemini AI助手。这些升级将大幅提升用户体验,令人期待。
本周科技圈风云激荡:TikTok 面临美国最高法院裁决,或将被迫停运;Meta 在美国终止事实核查,引发争议;ChatGPT 推出全新任务功能,为用户提供智能日程管理;Beat Saber 在 Quest 平台销量突破千万,AI 电影制作技术展现惊人潜力。
AI正重塑人类生活的方方面面,从商业到国防再到社会政策。AI计算能力与全球影响力息息相关。各国和企业纷纷投资巨额资金建设数据中心,以增强AI实力。预计到2030年AI市场规模将达1.81万亿美元,掌握最佳数据和计算平台的国家将占据优势地位。AI计算力的竞争已成为21世纪全球力量的决定性较量。