至顶网服务器频道 12月06日 新闻消息:这家以GPU为核心业务的芯片制造商今天更新了其GPU云,旨在支持日常桌面应用。现在,运行该公司消费级泰坦图形加速器的设备已经能够享受到此前专供企业平台的深度学习功能。
NVIDIA副总裁兼企业系统总经理Jim McHugh在一份声明中指出,“这实际上只是实现该软件的开放访问。我们的目标是将其真正带入普罗大众。”
GPU云提供一整套AI开发套件,且专门针对NVIDIA芯片进行了优化。其具体阵容包括预先打包的高人气开源深度学习引擎,例如谷歌公司的TensorFlow框架、Facebook公司打造的Caffe 2平台等等。每款工具都与NVIDIA提供的各类软件组件捆绑在一起,以帮助开发人员充分芯片资源支撑AI项目。
这些套件当中还包含负责执行数据可视化的解决方案。以图形形式探索信息内容的能力对于工程及科学用例而言非常重要,而这也正是推动GPU销售情况的一大助力。
NVIDIA方面表示,其软件包组合的预配置设计将能够显著降低AI开发环境配置工作当中所涉及的大量手动操作环节。捆绑软件以软件容器形式交付,这意味着企业客户能够在多种不同类型的基础设施之上对其进行部署。
NVIDIA同时指出,这套方案还具备额外的可移植性优势。具体来讲,当需要更多计算资源时,开发人员能够立足自有桌面系统对AI模型进行原型设计,并轻松将代码推送至企业的后端环境当中。这样的能力有效解决了将深度学习模型由一种基础设施移植至另一种基础设施时,经常带来的种种技术挑战。
事实上,NVIDIA的GPU云现在已经能够与采用泰坦显卡的普通台式机协同工作,这将使得更多开发者能够利用其强大功能。该芯片制造商也有意促进人工智能模型的构建,特别是考虑到当前运行的人工智能模型中有很大一部分依靠其图形芯片进行驱动。
McHugh解释称,“大多数开发人员的工作都以自己的台式机作为起点。如今,研究人员、学术人员甚至是业余爱好者都能够获得同样的能力。”
新的桌面兼容性机制还引入了对两套新型深度学习框架的支持能力。首先是中国搜索巨头百度公司去年发布的PaddlePaddle引擎,其允许开发人员利用远低于其它同类方案的代码量实现模型构建。另一套则为MXNet的1.0版本——即由Amazon.com旗下云事业部所支持的AI框架。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。