AI绘画是近年来热门的话题之一,不仅仅局限于艺术家群体,已经有越来越多的人和机构,通过AI绘画来实现自己的创作需求。譬如游戏公司,通过AI绘画来获得初级的场景和人物形象素材;电商公司,通过AI绘画更快地实现产品描述配图等。
去年11月,UCloud上线了AI绘画stable diffusion平台,在GPU云主机内置stable diffusion模型,提供jupyter可编程页面,根据用户的创意描述来生成图片。今年,UCloud将AI绘画平台全新升级,内置可视化操作界面,提供图像精准控制(Controlnet)、图像分割(Segment Anything)、图像微调等插件,为艺术创作者和设计师提供更多便利。
在UCloud使用AI绘画服务,创建仅需三步:
1) 创建GPU云主机,镜像市场选择“AI绘图 Web UI”镜像,防火墙策略开放7860端口接口
2) 登录GPU云主机,执行镜像首页提示的命令,就可快速启动AI绘画服务
3) 登录http://eip:7860即可访问stable diffusion Web UI页面(EIP为创建的GPU云主机的外网ip)
*参考文档:
https://docs.ucloud.cn/gpu/practice/stable_diffusion_webui
产品新特性:
可视化操作界面,预装多种风格模型
目前已预装stable-diffusionV1.5,stable-diffusionV2.1,anythingV3(动漫风格),dreamlike-photoreal(写实风格),deliberate_v2(写实风格)等模型。
以Prompt:
“a grey cat, headphone, cyberpunk”为例,不同模型出图效果示例如下:
Anything V3
Deliberate
Stable diffusionV2.1
图像精准控制
在AI绘画平台镜像中,已配置Controlnet插件,预装了canny、openpose、scribble等图像精准控制模型,支持边缘检测、pose指定、涂鸦等图像条件输入。
以canny模型为例,输入及输出结果如下:
Input
Output
以openpose模型为例,输入及输出结果如下:
Input
Output
以scribble模型为例,输入及输出结果如下:
Input
Output
图像分割
预装segment anything插件,支持图像分层,切割,单次可处理单张或多张图片。页面预览如下:
例如输入一只猫的图片,基于预装的sam模型,可以快速实现图像的分层、蒙版、分割。如下图所示:
Input
Output
图像微调
AI绘画平台镜像预装Additional-Networks插件,支持基于LoRA模型微调图片风格。
在webui页面操作步骤如下:
1) Checkpoint选择
“chilloutmix_NiPrunedFp32Fix.safetensors”
2) 选择“Additional Network”
3) module选择“LoRA”
4) 选择需要叠加的风格模型
模型选择页面
以Prompt:
“a grey cat, headphone, cyberpunk”为例,如图所示模型输出结果如下:
Input
Output
写在最后
AI绘画的应用场景非常广泛,可以用来创作美术作品、设计图形、制作动画和游戏等。它能够快速地生成高质量的图像和图形,同时还能够自动化一些重复性的工作,节省了大量的时间和精力。所以,不论您是专业的绘画爱好者,还是对AI技术感兴趣的普通人,都欢迎通过我们的AI绘画服务来体验一次AI与艺术的融合。
更多产品咨询,请扫码了解
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。