VGN5i实例将NVIDIA Quadro虚拟工作站功能引入阿里云市场
美国加利福尼亚州圣何塞——GPU技术大会——2019年3月18日——今天,在硅谷举办的2019年NVIDIA GPU技术大会(GTC)上,阿里云发布了国内首个公共云虚拟GPU异构计算产品VGN5i实例,打破了传统直通模式的局限,可以提供比单颗物理GPU更细粒度的服务,帮助企业用户降低成本、提高业务运维效率。
据悉,该产品基于NVIDIA Tesla P4 GPU,支持多种规格,企业可以按需选择适当的实例规格或者选择云市场NVIDIA Quadro虚拟工作站(Quadro vWS),该产品适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。阿里云表示,5月还将率先发布基于NVIDIA T4的GPU异构计算产品VGN6i实例,NVIDIA T4采用最新的Turing架构,在虚拟化环境中更为灵活,NVIDIA T4 GPU拥有可加速深度学习和推理工作流程的Tensor Core,以及可加速光线追踪和批量渲染的RT Core。对于GPU密度较低的工作负载而言,VGN6i最小可以提供单颗GPU十六分之一的虚拟工作站性能。
云端异构计算并非单纯地堆积硬件性能,需要做深度的软硬件结合及优化才能发挥其性能优势。阿里巴巴集团在异构计算领域拥有多年研发经验,该技术大规模应用于拍立淘、商品分类等场景。2017年10月,阿里云将自身积累多年的技术对外开放,面向企业推出了业界最全的异构计算家族,以及基于一个异构平台的高性能计算平台E-HPC,当用户业务遇到业务高峰时可以在数分钟内实现扩容,大幅降低了企业使用异构计算能力的门槛,目前已服务于新浪微博、旷视科技、中国工程院等众多企业和机构。
然而,在不少使用异构计算服务的场景中,“计算资源过剩”问题也尤为明显。以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算;人工智能领域也存在类似问题,深度学习推理场景对GPU的计算资源消耗可能仅仅是训练阶段的数十分之一,甚至更少。对于这类应用场景而言,云计算可以助力灵活性的提升和成本的降低。
为此,阿里云首次基于KVM架构与NVIDIA合作研发了异构计算产品。据了解,该产品集成了阿里云智能资源调度技术,可以为用户提供基于工作负载需要的资源分配;同时,还采用了安全隔离技术,实现不同用户之间的强隔离,有效防止信息泄漏;除此之外,QoS控制技术保障了每个用户的GPU资源不被其他租户抢占。阿里云智能异构计算产品专家张新涛表示,“随着GPU异构计算产品的推出,阿里云实现了基于NVIDIA GPU的异构计算场景全覆盖,可以为用户提供从灵活、随需而变的计算到高性能计算的服务。”
作为全球前三、国内第一的云服务商,阿里云拥有丰富的异构计算产品,具备智能调度、自动运维、实时扩容等能力,结合业界首个自研的异构计算加速框架Ali-Perseus,可以同时支持TensorFlow、Caffe、MxNet、Pytorch等流行机器学习框架在集群训练和推理时的加速,最高可以将深度学习任务成本降低50%以上。2018年12月,在斯坦福大学发布的最新DAWNBench深度学习推理榜单,阿里云异构计算获得了图像识别性能及成本双料冠军。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。