NVIDIA认证系统计划进一步扩展,现已包含50多种面向企业数据中心的NVIDIA认证系统。涵盖了华硕、戴尔科技、技嘉科技、慧与、联想集团、云达科技、超微及其他公司的主力x86服务器。
美国加利福尼亚州圣克拉拉市——COMPUTEX——2021年5月31日——NVIDIA于今日宣布数十款全新服务器已获得认证,可运行NVIDIA AI Enterprise软件,这标志着NVIDIA认证系统TM计划在迅速扩展,目前已经包含来自全球领先制造商的50多种系统。
研华科技、Altos、永擎电子、华硕、戴尔科技、技嘉科技、慧与、联想、云达科技、超微等公司的NVIDIA认证系统数量日益提升,包括一些在主流数据中心使用的主流X86服务器。它们将赋能医疗、制造、零售和金融服务等行业的AI。
凭借NVIDIA认证系统,企业能够支持传统数据中心以及混合云中的各种复杂工作。其中包括在VMware vSphere上运行NVIDIA AI Enterprise和数据分析软件,来部署支持AI的企业级平台,从而实现批量运行AI工作负载;还包括在NVIDIA Omniverse™ Enterprise上实现设计协作、高级模拟以及在红帽OpenShift平台上实现AI部署。 系统还可与 Cloudera 数据工程和机器学习无缝集成,把交付模型的时间从几个小时缩短至几分钟。
NVIDIA企业计算负责人Manuvir Das表示:“每个行业的企业都需要基于传统数据中心基础设施,为自身的AI创新工作提供有力支持。开放的、不断成长的NVIDIA认证系统生态圈在服务器方面为客户提供了前所未有的丰富选择,这些服务器经过NVIDIA验证,具有赋能世界级AI的能力。”
种类丰富的NVIDIA认证系统助力实现加速计算
NVIDIA 认证系统经过严格的测试,在性能、安全性和可扩展性方面延续NVIDIA 的设计最佳实践。这些系统的价格和性能水平各异,采用NVIDIA A100、A40、A30或A10 Tensor Core GPU以及NVIDIA BlueField-2 DPU或NVIDIA ConnectX-6系列网卡。
在高级AI训练和云计算服务领域,戴尔科技,慧与,宁畅和超微率先推出基于NVIDIA HGXTM加速计算平台、经过认证的新服务器。这些产品通过四或八个NVIDIA A100 GPU、NVIDIA NVLink(R) GPU互连技术、NVIDIA InfiniBand网络以及NVIDIA AI和HPC软件栈提供领先的AI性能。
首批NVIDIA认证系统运用BlueField-2 DPU提升安全性
今年下半年,几家全球领先的系统制造商将首次发布多款经过新一类NVIDIA认证系统的服务器。这类新认证系统将通过BlueField-2 DPU(数据处理器)在网络、存储和安全性能上实现突破。
通过卸载CPU的工作任务,单一BlueField-2 DPU可以提供多达125个CPU核才能实现的数据中心服务,从而释放服务器CPU周期以支持各种关键业务应用。
BlueField-2 DPU得到了软件基础设施领导者的广泛支持,包括红帽和VMware。为协助开发者构建支持BlueField-2 DPU的应用程序,红帽免费为开发者提供针对红帽企业版 Linux 操作系统的红帽开发者订阅版。
NVIDIA 认证将于2022年扩展至Arm CPU服务器
为了将Arm生态系统扩展至企业以实现高性能AI计算,技嘉科技和纬颖科技计划将提供新的服务器,其采用基于Arm Neoverse™ 的CPU、 NVIDIA Ampere架构GPU和/或BlueField-2 DPU。这款服务器预计将于明年上市,届时将被提交至NVIDIA进行认证。
技嘉科技正与NVIDIA 合作提供一款Arm HPC开发者套件,为HPC、AI和科学计算应用开发提供硬件和软件一体化的平台。该平台经NVIDIA验证,可满足严苛的HPC应用要求,它包含一个来自Ampere Computing的基于Arm Neoverse™的Ampere® Altra®处理器、两个A100 GPU、两个BlueField-2 DPU以及NVIDIA HPC SDK。
供应情况
采用NVIDIA Ampere架构GPU的NVIDIA认证系统现已上市,采用NVIDIA BlueField-2 DPU的系统和采用Arm CPU的系统将分别于今年晚些时候和2022年上市。
符合条件的开发者可即刻申请使用NVIDIA Arm HPC开发者套件。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。