国内首家，阿里云发布基于公共云的虚拟GPU服务

在硅谷举办的2019年NVIDIA GPU技术大会（GTC）上，阿里云发布了国内首个公共云虚拟GPU异构计算产品VGN5i实例，打破了传统直通模式的局限，可以提供比单颗物理GPU更细粒度的服务，帮助企业用户降低成本、提高业务运维效率。

VGN5i实例将NVIDIA Quadro虚拟工作站功能引入阿里云市场

美国加利福尼亚州圣何塞——GPU技术大会——2019年3月18日——今天，在硅谷举办的2019年NVIDIA GPU技术大会（GTC）上，阿里云发布了国内首个公共云虚拟GPU异构计算产品VGN5i实例，打破了传统直通模式的局限，可以提供比单颗物理GPU更细粒度的服务，帮助企业用户降低成本、提高业务运维效率。

据悉，该产品基于NVIDIA Tesla P4 GPU，支持多种规格，企业可以按需选择适当的实例规格或者选择云市场NVIDIA Quadro虚拟工作站（Quadro vWS），该产品适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。阿里云表示，5月还将率先发布基于NVIDIA T4的GPU异构计算产品VGN6i实例，NVIDIA T4采用最新的Turing架构，在虚拟化环境中更为灵活，NVIDIA T4 GPU拥有可加速深度学习和推理工作流程的Tensor Core，以及可加速光线追踪和批量渲染的RT Core。对于GPU密度较低的工作负载而言，VGN6i最小可以提供单颗GPU十六分之一的虚拟工作站性能。

从高性能到异构计算，阿里云实现场景全覆盖

云端异构计算并非单纯地堆积硬件性能，需要做深度的软硬件结合及优化才能发挥其性能优势。阿里巴巴集团在异构计算领域拥有多年研发经验，该技术大规模应用于拍立淘、商品分类等场景。2017年10月，阿里云将自身积累多年的技术对外开放，面向企业推出了业界最全的异构计算家族，以及基于一个异构平台的高性能计算平台E-HPC，当用户业务遇到业务高峰时可以在数分钟内实现扩容，大幅降低了企业使用异构计算能力的门槛，目前已服务于新浪微博、旷视科技、中国工程院等众多企业和机构。

然而，在不少使用异构计算服务的场景中，“计算资源过剩”问题也尤为明显。以云游戏为例，企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算；人工智能领域也存在类似问题，深度学习推理场景对GPU的计算资源消耗可能仅仅是训练阶段的数十分之一，甚至更少。对于这类应用场景而言，云计算可以助力灵活性的提升和成本的降低。

为此，阿里云首次基于KVM架构与NVIDIA合作研发了异构计算产品。据了解，该产品集成了阿里云智能资源调度技术，可以为用户提供基于工作负载需要的资源分配；同时，还采用了安全隔离技术，实现不同用户之间的强隔离，有效防止信息泄漏；除此之外，QoS控制技术保障了每个用户的GPU资源不被其他租户抢占。阿里云智能异构计算产品专家张新涛表示，“随着GPU异构计算产品的推出，阿里云实现了基于NVIDIA GPU的异构计算场景全覆盖，可以为用户提供从灵活、随需而变的计算到高性能计算的服务。”

作为全球前三、国内第一的云服务商，阿里云拥有丰富的异构计算产品，具备智能调度、自动运维、实时扩容等能力，结合业界首个自研的异构计算加速框架Ali-Perseus，可以同时支持TensorFlow、Caffe、MxNet、Pytorch等流行机器学习框架在集群训练和推理时的加速，最高可以将深度学习任务成本降低50%以上。2018年12月，在斯坦福大学发布的最新DAWNBench深度学习推理榜单，阿里云异构计算获得了图像识别性能及成本双料冠军。

来源：业界供稿

0赞

好文章，需要你的鼓励

国内首家，阿里云发布基于公共云的虚拟GPU服务

从高性能到异构计算，阿里云实现场景全覆盖

来源：业界供稿

2019

03/25

09:47

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

阿里云李飞飞：将大模型，装进数据库里

国产软件再破记录！阿里云PolarDB数据库登顶TPC-C双榜第一

该需要多少 NVIDIA CUDA Cores ？

未来，就在我们手中

RTX5090震撼发布，一文带你看懂英伟达CES2025发布会。

深度学习最佳 GPU，知多少？

“数字中华”的1666天

一文读懂 GPU 资源动态调度

2024 AI服务器市场竞争格局

在“云端”找步调，典名科技的“十年长跑”纪实

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: