如果你想要深入了解最新的深度学习研究成果,那么现在就有一个好机会。
日前,NVIDIA推出了AI Playground,这是一个能够让任何人都可以在此亲身体验我们的研究成果演示的网上空间。
NVIDIA应用深度学习研究副总裁Bryan Catanzaro表示:“研究论文中总会提出各种又新又酷的想法,但这些想法往往只能被一小部分特定的人群读懂,而我们正在尝试让我们的研究成果变得更加通俗易懂。AI Playground可以让每个人都能与我们的研究成果进行互动,并从中获得乐趣。”
目前,AI Playground网站中已发布了三组演示,此三组演示均来自于NVIDIA于去年发表的杰出研究报告当中:即Image InPainting、Artistic Style Transfer和Photorealistic Image Synthesis。
Image InPainting模型是一种AI成像技术,该技术可以剔除图片中你不想要的内容,并由计算机生成逼真的替代方案,填补空白。你可以在Image InPainting中亲自上传并编辑你的照片,感受一下它的编辑效果。此项技术是于去年秋天在德国慕尼黑举行的欧洲计算机视觉会议(ECCV)上首次发布的。
Artistic Style Transfer可将一幅图像的画风逼真自然地运用到另一幅图像上。比如,用户可以在Artistic Style Transfer中上传自己朋友的照片,并将其转换成梵高风格的图像。这项研究成果是于去年八月份在温哥华计算机图形图像展(SIGGRAPH)上发布的。
Photorealistic Image Synthesis模型是一套基于深度学习的新型系统,其可利用条件生成式对抗网络来营造逼真的图像和虚拟环境。该演示的相关研究成果是于去年6月在盐湖城举行的计算机视觉和模式识别会议(CVPR)上的。
更多的演示将在在未来几个月中将陆续推出。
Catanzaro认为,AI Playground适用于所有对图片编辑和深度学习感兴趣的人。
Catanzaro表示:“NVIDIA在视觉计算与人工智能之间充当着桥梁的作用。这种关联性体现在我们的研究中,也体现在你在AI Playground上看到的演示中。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。