细说起来,AI应该是这几年最火爆的话题之一。在很多领域,AI已经可以部分取代之前只能由人类担任的工作,例如机器翻译有了AI加持后,译文的质量在很多场景下已经可以直接使用,但在艺术和绘画,这个体现人类独创性思维的领域,很难想象AI能和人类的想象力和手艺一较高下。
然而在2022年8月31日,这一“人类自信”似乎受到了挑战,由AI生成的画作《空间歌剧院(Théâtre D'opéra Spatial)》在美国科罗拉多州博览会的数字艺术类美术比赛中获得第一名。该奖项的授予引起很大争议,有人感叹“艺术的死亡在我们眼前展开”,也有人表示“凭借AI作品获奖并不能证明你就是艺术家”。对此,创作者表示自己并没有违反任何规则,提交作品时也标注出了所使用的AI绘画平台。两位评委事后更是表示不知道该标注指的是AI工具,但即使知道了也不会改变自己的选择。
图片AI生成画作《空间歌剧院(Théâtre D'opéra Spatial)》。
伴随着AI绘画工具的飞跃性发展,AI生成图片的质量和速度都有了显著提升。今年8月,AI绘画算法Stable Diffusion宣布开源,它生成速度极快,且具有较高的艺术性和观赏性,这更加使人怀疑:AI绘画是否会取代部分人类绘画?
虽然有此担忧,但是对于“把苍白的文字转为绚丽的图画”,这样的新鲜体验大部分人是不吝尝试的。国内外有不少科技公司都提供了这样的工具,为普通的“手拙党”提供一次妙笔生花的机会,也通过AI绘图的联想为专业绘图设计师提供更多的设计灵感。基于此,近期UCloud优刻得的GPU云主机也上线了AI绘画stable diffusion平台,在UCloud控制台创建GPU云主机时,在镜像市场选择“AI绘画stable diffusion平台”镜像,然后点击【立即创建】,机器创建成功之后,连接GPU云主机,就已完成所有前期配置。然后输入您心中的描述,例如:“A dream of a distant galaxy, by Caspar David Friedrich, matte painting trending on artstation HQ”,执行一下prompt命令,AI即可输出您心中“设计”的图片,示例图片如下:
(更多详细操作步骤见附录)
苏轼评王维诗曾言:“味摩诘之诗,诗中有画,观摩诘之画,画中有诗”。中国古典审美特别强调“诗情”与“画意”完美融合。对于一部分朋友们来说,心中纵有万千美景,无奈手拙难画一线,只能凝缩于几行文字,无法通过美妙的图片直抒胸臆,而AI绘画平台恰好提供这个工具。细想一下:“远看山有色,近听水无声”如果通过图片展示,应该也是一副赏心悦目的图卷吧。
也许Stable Diffusion目前还不能作为生产力工具,但不可否认,它让设计变得简单,也为设计方式带来更多多样化元素,让普通人打开了 AI 绘画的可能性。所以我们推荐大家实际部署玩下,让自己拥有更多的可能!
创建GPU云主机时,镜像选择“AI绘画stable diffusion平台”,操作路径:镜像市场——>AI绘画stable diffusion平台,便捷安装stable diffusion,镜像内置环境:CentOS 7.8。
推荐机型:GPU型云主机 T4S、V100S、P40
说明:
内存请选择32GB及以上,否则模型加载时可能会触发OOM。
绑定EIP并在外网防火墙放行TCP 8888端口。
nohup jupyter notebook &
目的在于后续可以在web页面浏览生成的图片,也可在web页面直接编写python交互式程序。
若需要开机自启,可以自行通过rc.local或systemctl配置。
conda activate ldm
执行脚本,输入您预想图画的描述,即可得到图片(以下以“a painting of Mads Mikkelsen smoking”为例),生成的图片在 /root/stable-diffusion/outputs/txt2img-samples/目录下。
cd stable-diffusion
python scripts/txt2img.py --rompt "a painting of Mads Mikkelsen smoking"
根据外网ip地址,访问http://EIP:8888img
输入token(在/root/.jupyter/jupyter_notebook_config.py中查看c.NotebookApp.token的配置,可自行修改。)
根据导航点击预览图片。
cd /root/demo
CopyErrorSuccess
需确保在ldm的conda环境中运行。
以下以生成图片“astronaut_rides_horse.png”为例做演示。
test.py
from torch import autocast
from diffusers import StableDiffusionPipeline
pipe = StableDiffusionPipeline.from_pretrained(
"./stable-diffusion-v1-4").to("cuda")
prompt = "a photo of an astronaut riding a horse on mars"
with autocast("cuda"):
image = pipe(prompt)["sample"][0]
image.save("astronaut_rides_horse.png")
好文章,需要你的鼓励
TechCrunch Disrupt 2025 AI舞台将汇聚塑造科技未来的领军人物,顶尖风投将揭示在快速变化的AI领域获得融资的关键。来自Apptronik、ElevenLabs、Hugging Face、Runway等创新企业的领导者将分享前沿洞见,探讨AI如何重塑创意过程、改变物理世界、变革国防安全和重新定义人际关系。10月27-29日,五大主题舞台将在旧金山呈现科技创新的未来图景。
西班牙研究团队提出了一种创新的AI自我纠错方法SSC,让人工智能学会识别和修正规则中的漏洞。当AI发现自己在钻空子获得高分时,它会反思规则的合理性并主动改进。实验显示这种方法将AI的"钻空子"行为从50-70%降低到3%以下,同时提升了回答质量。这项技术有望让AI从被动执行指令转变为能够质疑和改进指令的智能协作伙伴。
英超联赛与微软达成五年战略合作伙伴关系,推出AI驱动的Premier League Companion服务,为全球球迷提供个性化体验。该服务利用Azure OpenAI技术,整合30多个赛季的统计数据、30万篇文章和9000个视频,帮助球迷发现和了解更多内容。未来还将为Fantasy Premier League引入个人助理经理功能,并通过Azure AI优化比赛直播体验和赛后分析。
这篇文章详细解析了Long、Shelhamer和Darrell在2015年CVPR会议上发表的开创性研究"全卷积网络用于语义分割"。文章以通俗易懂的方式,将这项复杂的技术比作艺术家的绘画过程,解释了如何让计算机不仅识别图像中有什么物体,还能精确标出每个物体的位置和边界。研究团队通过将传统分类网络改造为全卷积形式,并巧妙运用上采样和跳跃连接技术,实现了高效准确的像素级图像理解。这一突破为自动驾驶、医学影像和增强现实等领域带来了革命性变化,奠定了现代计算机视觉的重要基础。