戴尔今天宣布对高性能计算服务器产品线进行扩充,推出了一系列采用Nvidia和英特尔最新芯片硬件的新系统。
戴尔表示,此次推出的PowerEdge服务器是与这些芯片厂商合作设计的,将使任何规模的企业都能执行AI模型训练、高性能计算建模和模拟、核心到边缘推理以及数据可视化等工作负载。
此次推出的新型号中,最高端的是PowerEdge XE9680系统,戴尔称它是首款配备了8个GPU的高性能服务器。戴尔表示,客户可以选择Nvidia的H100 Tensor Core GPU或者是A100 Tensor Core GPU,再结合即将面市的第四代英特尔Xeon Scalable GPU,以及戴尔全新的智能冷却技术,为AI工作负载提供无与伦比的性能。
其次是PowerEdge XE9640,一款2U的性能优化型服务器,配备了4个英特尔新的Data Center GPU Max系列处理器以及2个英特尔Xeon Scalable CPU。据戴尔称,PowerEdge XE9640全面采用直接液体冷却的方式,可以将能源成本降低多达3.1倍,同时实现更高的机架密度。
最后是PowerEdge XE8640,一款风冷式4U性能型服务器,配备4个Nvidia H100或者A100 GPU、2个英特尔Xeon Scalable CPU以及Nvidia NVLink技术。这三款服务器都将于2023年上半年在全球范围内供货。
戴尔表示,此次发布是推动高性能计算和人工智能更大范围的普及。为此,戴尔的HPC PowerEdge服务器今天将通过Dell Apex在美国上市,这是一款即用即付型基础设施产品,将本地的、按使用付费的基础设施服务器和存储与云托管资源相结合。
戴尔认为,这很可能会改变市场的游戏规则,让任何规模的企业组织都能够通过一种完全托管的、订阅式的体验,在即服务的基础上运行大规模、计算密集型高性能计算工作负载。戴尔表示,客户通过使用Apex高性能计算产品可以访问运行高性能计算工作负载所需的一切,包括高性能计算集群管理器、容器编排器、工作负载管理器和底层硬件,并且这些硬件都针对生命科学或者是制造等特定工作负载进行了优化。客户也可以受益于灵活的容量选项,包括一年、三年和五年的订阅方式。
戴尔PowerEdge、高性能计算和核心计算产品组合和产品管理副总裁Rajesh Pohani预测,市场对Apex高性能计算服务的需求将会很大。
他说:“随着计算创新不断加速以跟上需求的步伐,客户希望升级他们的IT环境并且采用先进的计算能力来加速发现和洞察的速度。全新的戴尔服务器和解决方案,将让各种规模的企业都能获得曾经只有全球最大研究机构和政府机构才能获得的技术,让他们能够应对高性能计算,简化人工智能的采用,并且推动他们的业务向前发展。”
此外,戴尔正在致力于利用量子计算加速计算。此次戴尔还推出了新的Dell Quantum Computing Solution量子计算解决方案,已经在美国和加拿大上市,旨在处理复杂的工作负载例如化学和材料模拟、自然语言处理和机器学习。该解决方案在戴尔PowerEdge服务器的基础上构建了典型的量子模拟器,并与IonQ基于云的量子计算服务进行集成,让企业客户能够在本地环境或者云端运行量子工作负载。
IDC分析师Peter Rutten表示,加速计算技术对于帮助企业从每天生成的海量数据中获取更多价值来说,是至关重要的。“戴尔将抓住加速Dell PowerEdge服务器和解决方案的机会,满足客户处理苛刻工作负载的需求。”
好文章,需要你的鼓励
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
Gradient Labs首席执行官Dimitri Masin认为,企业使用AI客服代理时应仅在机器人成功解决问题时付费。他批评Salesforce按对话收费的模式,指出其AI代理在单轮对话中成功率仅58%,多轮对话更低至35%。Masin提出按解决方案计费的模式,声称可为企业节省约70%成本,并通过分层定价反映不同复杂度查询的价值差异。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。