当前位置:资讯 > 社会 > 正文
你昨晚关注的那个福利姬,可能是假的。
2023-02-26 09:47:21 来源: 差评

本文原创于微信公众号:差评作者:世超

前两天,有同事在编辑部的车车群里来了一组图:


(资料图片仅供参考)

如图示 ▼

平时毫无声息的群里,顿时人潮涌动,大家纷纷指责他不厚道,留图不留种。

在众人的好言劝说(威逼利诱)下,他留下了一串蓝色的链接。

嗯?AI!你跟我说 这些图全是 AI 画的??

一张真人都没有???

链接里的 Civitai 是一个 AI 画图模型分享网站,有大量来自世界各地的炼丹师(调试 AI 的人)把自己训练的 AI 模型分享上来。

不过这部分内容估计大家已经不陌生了,我就不多赘述了。

之所以老调重谈,是因为微软往 AI 画图圈子里扔了个新东西:LoRA。

说人话就是,以前的 AI 画图模型就像是焊死的一体机。不论是换硬盘、显卡还是内存,都得整块主板一起换,整体重装。

但是微软搞出来的这个 LoRA,把 AI 画图的模型给 “模块化” 了,可以单独训练背景、人脸、风格等等。

等真正画图的时候,再像拼积木一样,把好多 LoRA 模型拼起来就好。

这么做的好处显而易见:自由度更高,并且对资源的开销更小。

以 Civitai 上的 DingZhenLora 模型为例,作者只是用15张丁真的照片,就生成了一个效果还行的丁真 Cosplay AI,而且它的模型大小更是不到150MB。

放在以前,这几个数后面至少得加个 0。

更厉害的是,作者 “武当山真人” 只用 3070 跑了 20 分钟,就生成了这个模型。。。

十几张原始样本,3070的算力只需要不到半小时。。。训练 AI 的门槛,已经这么低了吗!

还不赶紧亲自试一下!

从米罗那薅几十张美照,然后找个3070Ti的电脑,开炼!

米罗美照▼

确实只用了半个多小时,我们的抽象米罗生成器就诞生了!

快是真的快!

不过,效果稍微有点那啥。。。

看来,玩定制AI也并不是有手就行。

我研究了一下发现,假如要想做到像之前提到的 DingZhen LoRA 那么像,还需要花更多的时间去细致的调节一下小的模型参数。

然而,我还没来得及喝口茶,坐下来,开始研究调参,又有一个功能劲爆程度丝毫不亚于LoRA的新技术出现了。。。

这次的主角叫ControlNet,它能够引导 AI 输出更精确的内容。

不知道大家发现没有,咱们平常在网上看到的 AI 生成图片,里面的人物姿势总是大同小异?

这是因为 AI 会有一种 “惰性”,更喜欢生成接近原图(训练素材)的内容。

以前要想让 AI 生成不同姿势的图片,就得使用提示词(抬头、向左看、跑步……)。

但是很多时候,提示词很难精确描述我们想要的姿态 —— 而且 AI 也不一定能正确理解。

就比如,早期 AI 不能理解啥是游泳。

ControlNet 就能很好的解决这个问题。

只要上传一张人物照片给 ControlNet,它就能分析这张图片的人物肢体框架,然后指挥 AI 生成肢体动作类似的新图片。

完全不需要任何姿势相关的提示词!

光是这一点,ControlNet 就足够神奇了。。。

而且这还没完,仅仅就是一个周末的功夫,ControlNet 又被发现了一个足以改变 AI画图历史的用法!

它可以通过骨架控制手型 —— AI 会画手了!!!

估计大家早就听说过 AI “不会画手” 的笑话,甚至已经有人脑洞大开了:

假如我带上 “假手指” 再干坏事,是不是就可以一口咬定监控是 AI 生成,从而逃脱罪责了?

呵呵,这些人的想法可以胎死腹中了。

而除了控制人物骨架,ControlNet 在上色和草稿补全方面也更进一步,正确理解了草稿中空白区域是“未涂色”,而不是“白色”。

在这之前,假如你喂给 AI 一张没上色的黑白草稿,它真就只会给你生成一张“黑白照”出来。。。

非常阴间。

哦对了,说到精确控制和上色。。。

就在我刚看完 ControlNet 能干嘛之后,还没来得及上手用,群里就又讨论起另外一个 AI 了。。。

和前文提到的那些非商业的模型不同,这次他们聊的 “ArkoAI” 是一款商业AI。

这款 AI 是专门为“土木工程”设计的,能把随手画的建筑的外观草图转换成概念渲染图。

这效果,感觉和真的建了一个3D模型一样。

连传统工业软件都开始入局,在我看来,AI 画图终于算是迈出了从“非常酷的玩具”到“新时代生产力工具”的这一步。

以前的 AI 只能生成一些短视频漫画风格照、渲染一些异形一样的人物照,而且对于指令的响应相当玄学。。。

但是现在,AI 已经可以制作一打演示图(甲方点头就行),生成一组情头(约稿的老板满意就行),渲染一堆现实中不存在的完美小姐姐(阿宅起立就行)。。。

我们不得不承认,AI画图已经能完成需要一些创意,但精确度要求不高的工作了。

而且最主要的是,现在这方面的技术发展实在是太快了!!!

就这一个周末,先是 LoRA,后是 ControlNet,然后 ArkoAI 也出来刷了一波存在。。。我从来没见过 AI 技术发展的这么迅速过!

我真的猜不到,明天一觉醒来,AI 又会带来一些什么惊喜。

图片、资料来源:

civitai,Korean Doll Likeness

civitai,DingZhenLora

Github,lllyasviel/ControlNet

Github,microsoft/LoRA

arxiv,Adding Conditional Control to Text-to-Image Diffusion Models

arxiv,LoRA: Low-Rank Adaptation of Large Language Models

ArkoAI——超级助理建筑师来了

责任编辑:zN_2654