NVIDIA认证系统计划进一步扩展,现已包含50多种面向企业数据中心的NVIDIA认证系统。涵盖了华硕、戴尔科技、技嘉科技、慧与、联想集团、云达科技、超微及其他公司的主力x86服务器。
美国加利福尼亚州圣克拉拉市——COMPUTEX——2021年5月31日——NVIDIA于今日宣布数十款全新服务器已获得认证,可运行NVIDIA AI Enterprise软件,这标志着NVIDIA认证系统TM计划在迅速扩展,目前已经包含来自全球领先制造商的50多种系统。
研华科技、Altos、永擎电子、华硕、戴尔科技、技嘉科技、慧与、联想、云达科技、超微等公司的NVIDIA认证系统数量日益提升,包括一些在主流数据中心使用的主流X86服务器。它们将赋能医疗、制造、零售和金融服务等行业的AI。
凭借NVIDIA认证系统,企业能够支持传统数据中心以及混合云中的各种复杂工作。其中包括在VMware vSphere上运行NVIDIA AI Enterprise和数据分析软件,来部署支持AI的企业级平台,从而实现批量运行AI工作负载;还包括在NVIDIA Omniverse™ Enterprise上实现设计协作、高级模拟以及在红帽OpenShift平台上实现AI部署。 系统还可与 Cloudera 数据工程和机器学习无缝集成,把交付模型的时间从几个小时缩短至几分钟。
NVIDIA企业计算负责人Manuvir Das表示:“每个行业的企业都需要基于传统数据中心基础设施,为自身的AI创新工作提供有力支持。开放的、不断成长的NVIDIA认证系统生态圈在服务器方面为客户提供了前所未有的丰富选择,这些服务器经过NVIDIA验证,具有赋能世界级AI的能力。”
种类丰富的NVIDIA认证系统助力实现加速计算
NVIDIA 认证系统经过严格的测试,在性能、安全性和可扩展性方面延续NVIDIA 的设计最佳实践。这些系统的价格和性能水平各异,采用NVIDIA A100、A40、A30或A10 Tensor Core GPU以及NVIDIA BlueField-2 DPU或NVIDIA ConnectX-6系列网卡。
在高级AI训练和云计算服务领域,戴尔科技,慧与,宁畅和超微率先推出基于NVIDIA HGXTM加速计算平台、经过认证的新服务器。这些产品通过四或八个NVIDIA A100 GPU、NVIDIA NVLink(R) GPU互连技术、NVIDIA InfiniBand网络以及NVIDIA AI和HPC软件栈提供领先的AI性能。
首批NVIDIA认证系统运用BlueField-2 DPU提升安全性
今年下半年,几家全球领先的系统制造商将首次发布多款经过新一类NVIDIA认证系统的服务器。这类新认证系统将通过BlueField-2 DPU(数据处理器)在网络、存储和安全性能上实现突破。
通过卸载CPU的工作任务,单一BlueField-2 DPU可以提供多达125个CPU核才能实现的数据中心服务,从而释放服务器CPU周期以支持各种关键业务应用。
BlueField-2 DPU得到了软件基础设施领导者的广泛支持,包括红帽和VMware。为协助开发者构建支持BlueField-2 DPU的应用程序,红帽免费为开发者提供针对红帽企业版 Linux 操作系统的红帽开发者订阅版。
NVIDIA 认证将于2022年扩展至Arm CPU服务器
为了将Arm生态系统扩展至企业以实现高性能AI计算,技嘉科技和纬颖科技计划将提供新的服务器,其采用基于Arm Neoverse™ 的CPU、 NVIDIA Ampere架构GPU和/或BlueField-2 DPU。这款服务器预计将于明年上市,届时将被提交至NVIDIA进行认证。
技嘉科技正与NVIDIA 合作提供一款Arm HPC开发者套件,为HPC、AI和科学计算应用开发提供硬件和软件一体化的平台。该平台经NVIDIA验证,可满足严苛的HPC应用要求,它包含一个来自Ampere Computing的基于Arm Neoverse™的Ampere® Altra®处理器、两个A100 GPU、两个BlueField-2 DPU以及NVIDIA HPC SDK。
供应情况
采用NVIDIA Ampere架构GPU的NVIDIA认证系统现已上市,采用NVIDIA BlueField-2 DPU的系统和采用Arm CPU的系统将分别于今年晚些时候和2022年上市。
符合条件的开发者可即刻申请使用NVIDIA Arm HPC开发者套件。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。