如题,我用 chatgpt 的 dall-e 画的时候,每画一次就是一个全新的人物形象,甚至发两次一模一样的描述,但是画出来的却是两幅截然不同的人物形象,能不能让它画出几张人物固定,只是背景变化的图片?如果 chatgpt 做不到的话,应该用 stable diffusion 还是 midjourney 才能做到?
1
easychen 275 天前 1
总体来说不能,不过你可以把上一张图作为附件传上去,要求它严格参考附件,会稍微好一点。
|
2
Genii 275 天前
https://github.com/InstantID/InstantID
需要一张人脸参考图片 |
3
mightybruce 275 天前
midjourney 可以做到, 选生成图片的时候带上 seed Midjourney 机器人使用种子编号创建视觉噪声场(扩散模型的起始图片),就像小时候电视没有信号屏幕上是雪花图,作为生成初始图片网格的起点。种子数是为每个图片随机生成的,但可以使用--seed 或 --sameseed 参数指定。使用相同的种子编号和提示产生相似的最终图片。
|
4
mightybruce 275 天前
stable diffusion 也要带上 seed,然后就是抽卡了。
|
5
ShadowPower 275 天前
Stable Diffusion 可以做到,用 control net 的 reference only ,或者仅用一张图训练 LoRA (或其他类似方法)
|
6
paopjian 275 天前
我记得有的插件可以选择绘图区域,你给他一张图,指定生成区域,他就会去改了
|
7
ShadowPower 275 天前
用一张图训练某个对象的方法是 DreamArtist++,可以搜得到。
如果是模型原本有能力生成的人物形象,只是没有固定的输入来稳定生成,那么效果其实会很好。 如果是随便找的,模型不一定能生成得出来的人物形象,效果会差一点。 |
8
buyno1 275 天前
刀 E 用 seed
|
9
justfindu 275 天前
https://juejin.cn/post/7293420609088978955
参考一下这个, 不过我没怎么读懂这个机翻... 大致意思是 dall-e 会给你生成 4 张图片, 并且在一个对话内会给图片标记 x123456789 之类, 然后下一个图给它这个标记. |
10
loryyang 275 天前
比较难确保完全一样,这也是目前投入生产的一个主要问题
使用扩散模型进行视频生成就会出现稳定性的问题 这两天爆火的 sora 就使用了不一样的思路,效果就好很多 |
11
BQsummer 275 天前
dall-e 也是扩散模型, 种子加噪声一致也出不了完全一致的人物, 只能尽量相似
|
12
LDa 275 天前
明确告诉你 dall-e 做不到 网上有教程说通过 seed 或者之类的技巧能一定程度上做到(同一个会话中)
|
13
yuhuan66666 275 天前
Stable Diffusion 的 controlNet 可以
|
14
gargar 275 天前 via iPhone
昨天刚试用了 @qingfengmuyun 的 Graphic AI 好像可以做到 https://www.v2ex.com/t/1015848
|