赋能3D设计 GANverse3D另辟蹊径实现2D到3D的图像转换原创

作者：李祥敬

GANverse3D应用为2D到3D的图像转换提供了全新的思路，而目前3D图像设计在建筑师、创作者、游戏开发人员与设计师等领域有着广泛的应用，这样GANverse3D具有广阔的应用空间。

因为从不同角度捕捉同一物体的真实数据集很少，所以大多数将图像从2D转换为3D的AI工具都是使用像ShapeNet这样的合成3D数据集进行训练的，而这样的逆图形模型依赖于3D图形作为训练数据。

NVIDIA研究院正在研发一种全新深度学习引擎，其把GAN模型变成了一个非常高效的数据生成器，这样就可以基于网络上的任何2D图像创建出3D对象。而且由于是根据真实图像而不是合成数据进行训练的，所以AI模型能更好地推广到现实世界的应用中。

据悉，由多伦多的NVIDIA AI研究实验室开发的GANverse3D应用将平面图像放大成逼真的3D模型，可以在虚拟环境中可视化和控制。这种性能可以帮助建筑师、创作者、游戏开发人员和设计师轻松地将新对象添加到他们的实体模型中，而不需要3D建模方面的专业知识，也不需要在渲染上花费大量预算。

从2D到3D GANverse3D独辟蹊径

为了从现实世界的数据中获得多视图图像，例如网上公开的汽车图像，NVIDIA研究人员转而使用GAN模型，修改其神经网络层，将其转化为数据生成器。

为了生成训练数据集，研究人员利用生成性对抗网络——GAN合成图像，从多个角度描绘同一物体——就像摄影师绕着一辆停着的汽车走动，从不同的角度拍摄。这些多视图图像被插入到逆图形的渲染框架中，逆图形是从2D图像推断3D网格模型的过程。

该团队发现，仅训练神经网络的前4层，冻结剩余的12层参数，可以让GAN从不同的角度渲染同一对象的图像；保持前4层参数冻结，其他12层可变，可以让神经网络基于同一角度生成不同的图像。

通过手动分配标准角度，在特定高度和距离拍摄车辆照片，研究人员可以从单个2D图像快速生成多视图数据集。

一旦完成了多视图图像训练，GANverse3D只需要一个2D图像即可预测3D网格模型。该模型可以与3D神经渲染器一起使用，使开发人员能够自定义对象和交换背景。

例如，单张汽车照片可以转换为3D模型，该模型可以在虚拟场景中行驶，并配有逼真的前灯、尾灯和转向灯。

最终的模型，在55000由GAN生成的汽车图像上训练而得，优于在流行的Pascal3D数据集上训练的逆图形网络。

从研究到生产 GANverse3D赋能3D设计

3D制作团队通常规模庞大、应用技术繁多且所在地点分散，NVIDIA Omniverse Enterprise可以让处于世界各地的3D设计团队跨多个软件套件工作，并在同一共享虚拟空间中进行实时协作的技术平台。目前，诸如宝马集团、Foster建筑事务所和WPP传播集团等公司已经在使用NVIDIA Omniverse Enterprise。

当作为NVIDIA Omniverse平台的扩展导入并在NVIDIA RTX GPU上运行时，GANverse3D可将任何2D图像重建为3D，将帮助游戏、架构和设计领域的创作者为游戏开发、城市规划甚至训练新的机器学习模型创建更丰富的虚拟世界。

并不是每个创作者都有时间和资源为他们所绘制的每一个对象创建3D模型。若要渲染展厅的汽车，或一条街的建筑，需捕获所需数量的多视图图像，成本可能高得令人望而却步。

而训练好的GANverse3D应用可以用来将汽车、建筑甚至一匹马的标准图像转换成可以在 Omniverse中自定义和制作动画的3D图形。借助Omniverse Connectors，开发人员可以在Omniverse中使用他们首选的3D应用程序，通过实时光线跟踪来模拟复杂的虚拟世界。

GANverse3D已经为诸如由Knight Rider的AI驱动的KITT等标志性汽车带来创新活力。为了重建 KITT，研究人员只需给训练好的模型输入汽车的图像，让GANverse3D预测相应的3D纹理网格，以及车辆的不同部分，例如车轮和前照灯。

然后，他们使用NVIDIA Omniverse套件和NVIDIA PhysX工具将预测的纹理转换成高质量的材料，使KITT具有更真实的外观和感觉，并将其与其他汽车一起放置在动态驾驶序列中。

总结

GANverse3D应用为2D到3D的图像转换提供了全新的思路，而目前3D图像设计在建筑师、创作者、游戏开发人员与设计师等领域有着广泛的应用，这样GANverse3D具有广阔的应用空间，特别是通过NVIDIA Omniverse触达用户，为用户业务创新提供更有力的支撑。

来源：至顶网计算频道

3D
NVIDIA

0赞

好文章，需要你的鼓励

赋能3D设计 GANverse3D另辟蹊径实现2D到3D的图像转换 原创

来源：至顶网计算频道

2021

04/19

11:46

分享

点赞

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

HPE发布Nvidia Blackwell驱动的AI服务器，抢占AI市场需求

ISACA推出AI安全管理高级认证项目

谷歌推出智能体SOC系统提升安全事件响应速度

Lumen升级400GB数据中心连接基础设施助力AI发展

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

多站点IT基础设施升级指南：告别VMware的替代方案

戴尔集成Elasticsearch与英伟达Blackwell GPU升级AI数据平台

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

NVIDIA 初创加速计划 | 2024 NVIDIA 创业企业展示完美收官!

老黄掏出“迷你版AI超算”，每秒67万亿次运算，仅售2070元人民币

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

赋能3D设计 GANverse3D另辟蹊径实现2D到3D的图像转换原创