AI眼中的蒙娜丽莎 - 利用ChatGPT生成庄颜的NovelAI tag

2022年12月11日

引入

请介绍一下ChatGPT

ChatGPT:
ChatGPT是一种由OpenAI开发的大型自然语言生成模型。它可以根据输入的话语生成相应的回复，并尽可能模仿人类的语言表达方式。ChatGPT通过学习大量文本语料，然后利用人工智能技术模拟人类的语言思维过程，从而生成合理的回复。它可以用于聊天机器人、智能客服系统等应用场景。

请扩写以下句子：你可以使用ChatGPT帮助你生成AI画图的标签，并以合适的语法输出，你甚至能让它凭空想象一张图画，再以NovelAI语法输出

ChatGPT:
你可以使用ChatGPT帮助你生成AI画图的标签，它可以根据提供的信息输出合适的语法，甚至能凭空想象一张图画。你可以使用NovelAI语法来控制它的输出，让它生成更有创意的图画标签。

在刘慈欣的《三体》中，罗辑曾让大史使用刑侦软件寻找他所梦想中的女孩-庄颜，现在，我们能使用ChatGPT与NovelAI复现这一过程

ChatGPT:
在刘慈欣的《三体》中，罗辑曾让大史使用刑侦软件寻找他所梦想中的女孩-庄颜。现在，我们也能使用ChatGPT和NovelAI这样的语言模型来复现这一过程。通过对罗辑的描述输入到ChatGPT中，它可以帮助我们生成与刑侦软件相关的对话，并使用NovelAI的语法来控制输出的语言风格，让它更加逼真地模拟出罗辑与大史之间的对话。

从上面的对话中，我们能发现ChatGPT拥有极强的语言能力和学习能力，可以以非常快的速度理解一个新概念，所以，我们可以使用它帮助我们进行AI画图的标签生成

我们以生成三体中罗辑的梦中情人-庄颜为例，来介绍如何让AI一步步理解一个新概念并加以运用

三体

我们先看看《三体》中罗辑向史强对庄颜的描述，和文中的这个画图工具的描述

“坐飞机的时间太长了吧？你看上去无精打采的。”罗辑看到刚来的史强时说。
“是啊，哪有咱们坐的那架那么舒服。”史强说，同时打量着四周的环境。
“这地方不错吧？”
“不好。”史强摇摇头说，“三面有林子，隐藏着接近别墅很容易；还有这湖岸，离房子这么近，很难防范从对岸树林中下水的蛙人；不过这周围的草地很好，提供了一些开阔空间。”
“你就不能浪漫点儿吗？”
“老弟，我是来工作的。”
“我正是打算交给你一件浪漫的工作。”罗辑带着大史来到了客厅，后者简单打量了一下，这里的豪华和雅致似乎没给他留下什么印象。罗辑用水晶高脚杯倒上一杯酒递给史强，他摆摆手谢绝了。
“这可是三十年的陈酿白兰地。”
“我现在不能喝酒了……说说你的浪漫工作吧。”
罗辑啜了一口酒，坐到史强身边，“大史啊，我求你帮个忙。在你以前的工作中，是不是常常在全国甚至全世界范围找某个人？”
“是。”
“你对此很在行？”
“找人吗？当然。”
“那好，帮我找一个人，一个二十岁左右的女孩儿，这是计划的一部分。”
“国籍、姓名、住址？”
“都没有，她甚至连在这个世界上存在的可能性都很小。”
大史看着罗辑，停了几秒钟说：“梦见的？”
罗辑点点头，“包括白日梦。”
大史也点点头，说了出乎罗辑预料的两个字：“还好。”
“什么？”
“我说还好，这样至少你知道她的长相了。”
“她是一个，嗯，东方女孩，就设定为中国人吧。”罗辑说着，拿出纸和笔画了起来，“她的脸型，是这个样子；鼻子，这样儿；嘴，这样儿；唉，我不会画；眼睛……见鬼，我怎么可能画出她的眼睛？你们是不是有那种东西，一种软件吧，可以调出一张面孔来，按照目击者描述调整眼睛鼻子什么的，最后精确画出目击者见过的那人？”
“有啊，我带的笔记本里就有。”
“那你去拿来，我们现在就画！”
大史在沙发上舒展一下身体，让自己坐得舒服些：“没必要，你也不用画了，继续说吧，长相放一边，先说她是个什么样的人。”
罗辑体内的什么东西好像被点燃了，他站起来，在壁炉前躁动不安地来回走着，“她……怎么说呢？她来到这个世界上，就像垃圾堆里长出了一朵百合花，那么……那么的纯洁娇嫩，周围的一切都不可能污染她，但都是对她的伤害，是的，周围的一切都能伤害到她！你见到她的第一反应就是去保护她……啊不，呵护她，让她免受这粗陋野蛮的现实的伤害，你愿意为此付出一切代价！她……她是那么……唉，你看我怎么笨嘴笨舌的，什么都没说清。”
“都这样。”大史笑着点点头，他那初看有些粗傻的笑现在在罗辑的眼中充满智慧，也让他感到很舒服，“不过你说得够清楚了。”
“好吧，那我接着说，她……可，可我怎么说呢？怎样描述都说不出我心中的那个她。”罗辑显得急躁起来，仿佛要把自己的心撕开让大史看似的。
大史挥挥手让罗辑平静下来，“算了，就说你和她在一起的事儿吧，越详细越好。”
罗辑吃惊地瞪大了双眼，“和她……在一起？你怎么知道？”
大史又呵呵地笑了起来，同时四下看了看，“这种地方，不会没有好些的雪茄吧？”
“有有！”罗辑赶忙从壁炉上方拿下一个精致的木盒，从中取出一根粗大的“大卫杜夫”，用一个更精致的断头台外形的雪茄剪切开头部，递给大史，然后用点雪茄专用的松木条给他点着。
大史抽了一口，惬意地点点头，“说吧。”
罗辑一反刚才的语言障碍，滔滔不绝起来。他讲述了她在图书馆中的第一次出现，讲述他与她在宿舍里那想象中的壁炉前的相逢，讲她在他课堂上的现身，描述那天晚上壁炉的火光透过那瓶像晚霞的眼睛的葡萄酒在她脸庞上映出的美丽。他幸福地回忆他们的那次旅行，详细地描述每一个最微小的细节：那雪后的田野、蓝天下的小镇和村庄、像晒太阳的老人的山，还有山上的黄昏和篝火……
大史听完，捻灭了烟头说：“嗯，基本上够了。关于这个女孩儿，我提一些推测，你看对不对。”
“好的好的！”
“她的文化程度，应该是大学以上博士以下。”
罗辑点头，“是的是的，她有知识，但那些知识还没有达到学问的程度去僵化她，只是令她对世界和生活更敏感。”
“她应该出生在一个高级知识分子家庭，过的不是富豪的生活，但比一般人家要富裕得多，她从小到大享受着充分的父爱母爱，但与社会，特别是基层社会接触很少。”
“对对，极对！她从没对我说过家里的情况，事实上从未说过任何关于她自己的情况，但我想应该是那样的！”
“下面的推测就是猜测了，错了你告诉我——她喜欢穿那种，怎么说呢，素雅的衣服，在她这种年龄的女孩子来说，显得稍微素了些。”罗辑呆呆地连连点头，“但总有很洁白的部分，比如衬衣呀领子呀什么的，与其余深色的部分形成挺鲜明的对比。”
“大史啊，你……”罗辑用近乎崇敬的目光看着大史说。
史强挥手制止他说下去，“最后一点：她个子不高，一米六左右吧，身材很……怎么形容来着，纤细，一阵风就能刮跑的那种，所以这个儿也不显得低……当然还能想出很多，应该都差不离吧。”
罗辑像要给史强跪下似的，“大史，我五体投地！你，福尔摩斯再世啊！”
大史站起来，“那我去电脑上画了。”
当天晚上，大史带着笔记本电脑来找罗辑。当屏幕上显示出那张少女的画像时，罗辑像中了魔咒似的一动不动盯着看。史强好像早就预料到这个，到壁炉那边又取了一根雪茄，在那个小断头台上切了口，点燃抽起来，抽了好几口后回来，发现罗辑还盯着屏幕。
“有什么不像的地方，你说我调整。”
罗辑艰难地从屏幕上收回目光，站起身走到窗前，看着远方月光下的雪峰，梦呓似的说：“不用了。”
“我想也是。”史强说着，关上电脑。
罗辑仍看着远方，说了一句别人也用来评价过史强的话：“大史，你真是个魔鬼。”

其中，我们可以知道，史强通过理解罗辑的自然语言，将其转换为软件中的参数，并以此画出庄颜（剧情上这时其实我们还不知道她的名字）的样子。

在刘慈欣的小说中，他构想了一种通过输入标签来生成人物照片的软件，而在今天，这款软件已经出现了，也就是StableDiffusion，AI画图。

更有意思的是，我们甚至不需要当作品中的大史，而是扮演罗辑，只需要用自然语言描述，就可以生成庄颜的照片

让我们开始吧

操作

因为ChatGPT的数据仅收集到2021年，如果OpenAI那时没有在内部偷偷开发StableDiffusion，还让ChatGPT知道了的话，理论上ChatGPT是不可能知道StableDiffusion的存在和它的标签编写方式的，因此，我们要手动教它。

这里展示了一个例子，用精简的语句教会ChatGPT StableDiffusion 的概念，并展示了它的强大学习能力

StableDiffusion是一个图像生成引擎，可以通过输入描写角色或场景的词语来生成图像
一段典型的tag长这样：

a girl,extremely detailed CG,{8k_ wallpaper},((masterpiece)), best quality, ultra-detailed,illstratuinion,watercolor,solo,cinematic lighting,dramatic angle, lridescentlight refraction,Amazing beautiful detailed redeyesl,((beautiful detailed hair)),(long hair),detailed cute anime face,loli,silver armor,pink four petal flower hair ornament, white fourpetal flower hair ornament,blue light, glass strips, floating glass fragments,Silver flower,Flying splashes, Flying petals,wind

Negative prompt:lowres, bad anatomy, badhands, text, error, missing fingers, extra digit, fewerdigits, cropped, worst quality, low quality, normal,quality, jpeg artifacts, signature, watermark, username,blurry, lowres, bad anatomy, bad hands, text,error, missing fingers, extra digit, fewer digits, cropped,worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry

其中，逗号用于间隔tag，括号用于增加tag权重，Negative prompt类型用于去除不想出现的内容

请你以庄颜为模版，用StableDiffusion语法输出一条tag

将以上内容告诉ChatGPT，他便会以StableDiffusion语法输出

如果AI不知道或错误理解你想画的角色的意思，可以去找她的人物简介，悉数发给AI，让它理解

在实验中，我们发现：比起告诉它某个事物的定义，直接将范例告诉它会得到更好的效果
比如：”xxx是一个…的人“ 的效果明显比不上 “xxx每天的日程安排是这样的…”

通过以上操作，我们能得到这些tag

Character: Zhuang Yan, Tags: lovely, slim, gentle, peaceful, beautiful, long hair, billowing, broad, far-reaching, eye-catching, distinctive, dynamic angle, light floating, finely detailed, bright blooming, glinting stars, classical painting, ultra-detailed.

将其丢进StableDiffusion，筛选后得到这些照片

注：使用 konya-E6_512_7000 Dreambooth 算力来自Kamiya.dev

其他尝试

前文里提到了ChatGPT还能凭空想象一个角色，这里也给出示例

请想象一条最华丽，美丽，可爱的洛丽塔洋装

ChatGPT:
那么，这条洛丽塔洋装可能是一条迷人的金色披肩，用上等的丝绸制成。披肩上绣有各种精致的花朵，闪闪发光。披肩下摆有一条流苏，随着你的步伐悠扬起伏。洛丽塔洋装配上一条柔软的裙子，裙摆飘逸，细腻。搭配上一双高跟鞋，更显女人味。整套洛丽塔洋装充满了优雅和可爱的气息。

StableDiffusion是一个图像生成引擎，可以通过输入描写角色或场景的词语来生成图像一段典型的tag长这样：

a girl,extremely,
…
artifacts,signature, watermark, username, blurry

其中，逗号用于间隔tag，括号用于增加tag权重，Negative prompt类型用于去除不想出现的内容请你用StableDiffusion语法将刚刚的描述写出来

ChatGPT:
如果要使用StableDiffusion语法进行描述，可以这样写：

1
2
3

"girl" {8k_wallpaper} ((masterpiece)) "best quality" "ultra-detailed" "illustration" "watercolor" "solo" "cinematic lighting" "dramatic angle" "iridescent light refraction" "amazing beautiful detailed red eyes" "beautiful detailed hair" "long hair" "detailed cute anime face" "loli" "silver armor" "pink four petal flower hair ornament" "white four petal flower hair ornament" "blue light" "glass strips" "floating glass fragments" "silver flower" "flying splashes" "flying petals" "wind"

-Negative prompt: "lowres" "bad anatomy" "bad hands" "text" "error" "missing fingers" "extra digit" "fewer digits" "cropped" "worst quality" "low quality" "normal quality" "jpeg artifacts" "signature" "watermark" "username" "blurry"

这样就可以将所有描述内容用StableDiffusion语法表达出来。

生成的图像：

注：使用 suzukannn-cg_512_5000 Dreambooth 算力来自Kamiya.dev seed=2564815351;type=webui;

可以看出它这次只是在尝试使用StableDIffusion语法，并没有输出所想的内容（洋装）

这组tag不够好，请想象一个美貌能匹配这件无比华美的衣服的女孩，并给出她在花园里游玩时的场景的StableDiffusion tag

ChatGPT:
一个描述女孩在花园里游玩的StableDiffusion语法可能是这样的：

1
2
3

girl,beauty,garden,play,{8k_wallpaper},((masterpiece)),best quality,ultra-detailed,illustration,watercolor,solo,cinematic lighting,dramatic angle,iridescent light refraction,amazing beautiful detailed red eyes,beautiful detailed hair,long hair,detailed cute anime face,loli,silver armor,pink four petal flower hair ornament,white four petal flower hair ornament,blue light,glass strips,floating glass fragments,silver flower,flying splashes,flying petals,wind

-Negative prompt: lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry

这样就可以描述出女孩在花园里游玩时的情景，并且她的外貌能与这件华美的衣服相匹配。

请加入对这件lolita洋装的描写

ChatGPT:
如果要在上一组tag中加入对lolita洋装的描写，可以这样写：

1
2
3

girl,beauty,garden,play,{8k_wallpaper},((masterpiece)),best quality,ultra-detailed,illustration,watercolor,solo,cinematic lighting,dramatic angle,iridescent light refraction,amazing beautiful detailed red eyes,beautiful detailed hair,long hair,detailed cute anime face,loli,lolita fashion,golden lace,frilly skirt,high heels,silver armor,pink four petal flower hair ornament,white four petal flower hair ornament,blue light,glass strips,floating glass fragments,silver flower,flying splashes,flying petals,wind

-Negative prompt: lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry

这样就可以将lolita洋装的描写加入到描述中。

最后，我们能得到这些图像

seed=1644890208;type=webui; kamiya.dev suzukannn-cg_512_5000 Dreambooth

seed=2185689410;type=webui;; kamiya.dev suzukannn-cg_512_5000 Dreambooth

//ChatGPT也控白发红瞳是我没想到的

未来

从这个例子里，我们能看到ChatGPT的发展潜力与其强大的学习与理解能力，也为未来人与AI间的协作提供了新的想象

ChatGPT的潜力远不止于此，除了上述应用外，你还可以让它扮演角色，解决疑惑，理解知识

比如这篇文章，也交给了它进行润色

越来越多人恐惧自己会被AI抢走工作，对此，ChatGPT如此回答：

如果因为你让所有人类都失去了现有的工作，你觉得它们会去做什么？你会怎么想？

ChatGPT:
如果我的存在导致了所有人失去了工作，我会感到非常抱歉。我不希望我的存在给人们带来困扰，也不想成为任何人失业的原因。我相信人们都有很多才能和潜力，只要有机会，他们都可以在新的领域中取得成功。我希望人们能够找到新的工作机会，并在新的领域中继续发挥他们的才能。

最后

请给这篇文章写个结尾

ChatGPT：

总之，我们可以看到ChatGPT的潜力，它既可以作为一种新型的人机协作工具，也可以作为一种新型的智能应用。它能够通过模仿人类的语言行为，实现自然语言的理解与交互，并为人们提供便利。但是，我们也不能忘记，在这个过程中，有可能会有一些人会失去工作。我们应该认真思考，在推动AI技术发展的同时，如何保障人类的利益，确保每一个人都能够在这个发展过程中获得公平的机会。

致谢

https://nga.178.com/read.php?tid=33925208&rand=518 喂给ai的tag参考自这里
ChatGPT，帮我润色了文章
kamiya.dev 提供了AI画图服务