使用AI重新进行角色设计-三国之张角

一张尘封20年的手绘稿

翻箱倒柜整理旧物时,无意中发现了这张"上古"作品:

我在2003年设计的张角角色

这是我在 20 年前看了藤崎龙的《风神演义》后心血来潮画的三国演义里的张角。那时候的我还是个热血青年,满脑子都是"苍天已死,黄天当立"的中二情怀。看着这张略显稚嫩的手绘稿,突然想到一个有趣的问题:如果让现在的AI重新设计这个角色,会是什么样子呢?

AI vs 手绘:一场跨越时空的PK

之前已经试过了 ChatGPT 的绘图发现效果不错。这次碰到豆包升级了绘图功能,前阵子也拿到了 Lovart 的邀请码,于是就拿上面的画来试试,顺便对比一下这些AI的表现。毕竟,作为一个好奇宝宝,怎么能不折腾一下呢?

为了公平起见,我给 AI 的提示词都只有简单的一句话:"根据手绘图片,生成一张彩色的角色设计图"。

第一回合:豆包的华丽登场

豆包初次生成的张角

好家伙!豆包一开始生成的人物角色性别是女性。这...张角什么时候改行当女团偶像了?不过比较厉害的是它居然识别出了手绘稿中的文字,这个细节处理能力还是很强的。

但是很明显,豆包生成的人物姿势和手绘的并不一致,而且最让人哭笑不得的是,手绘中张角手上的拂尘居然变成了镰刀!难道AI觉得张角应该去收割韭菜?

于是我赶紧"调教"了一下豆包:

修正提示词后豆包生成的张角

在明确地告诉豆包人物的性别以及手上拿的是拂尘后,豆包改成了上面的样子。虽然性别问题解决了,但这个拂尘看起来更像是扫帚...张角这是要去做保洁工作吗?距离理想的情况还是有些差距。

第二回合:Lovart的独特演绎

Lovart初次生成的张角

Lovart 一开始也生成了一张女性角色,看来AI们都有把男性角色"娘化"的倾向啊!而且手上的拂尘变成了长枪,这是要让张角改行当武将的节奏?

经过同样的"纠正教育"后:

修正提示词后Lovart生成的张角

同样明确的告知后,Lovart 改的还可以,整体感觉比豆包稍微好一些,但是拂尘还是有些奇怪,总觉得不够飘逸。

技术宅的思考时间

从上面这场"人机大战"来看,我感觉这些以图生图的功能大概是这么个流程:

  1. 通过视觉识别将图像转换为文本描述
  2. 把文本描述和用户提示词合并交给生图模型

问题就出在第一步:AI在"看图说话"的时候就已经理解偏了。比如把拂尘看成镰刀、把男性看成女性等等。这个过程对于用户来说又是黑盒,只能事后补救,很有种"将错就错"的无奈感。

如果能将这个转化过程变成可调整的,让用户在生图前就能看到AI的"理解"并进行修正,是不是可以减少很多无谓的生图损耗呢?毕竟,每次重新生图都要消耗算力,既不环保也不经济。

小结

虽然AI还没能完美复刻我20年前的"神作",但这个实验过程还是挺有趣的。至少让我明白了一个道理:和AI沟通,真的需要"好好说话"。也许再过几年,AI就能更准确地理解我们的意图了。

到那时候,说不定我再翻出这篇文章,会觉得现在的AI还是太"天真"了呢!