【已解决】AI画图embedding训练不出来，有没有同专业的求教

crazy95sun · 发表于 2023-4-5 20:13:40

本帖最后由 crazy95sun 于 2023-4-9 22:07 编辑

省流：成了，关掉VAE（把model.vae.pt重命名成别的名字，重启）就能正常训练了

楼下分享一下结果（如果违规请版主单独删除，求不要干掉整个帖子）

目前为止用Novel AI泄漏模型+stable diffusion webui完全没法训练出可用的embedding。采用的D站上Furry Sheep介绍的方法，使用gelbooru资源训练textual inversion。目前配置如下

训练集是189张gelbooru爬下来的quad风格图，文件名是tag，使用预处理工具切成了512x512的标准大小，带左右翻转。
这189张风格不统一，我另一个实验还挑选了其中94张风格较为统一的，也使用了相同的方法预处理（效果也不好）。

创建embedding，名称为quadamp，初始关键字*，向量长度20

开始train，学习率固定为0.0005，使用subject_filewords.txt（也有另一个实验尝试了subject.txt，效果也不好）

使用txt2img的输入用于生成预览，输入是best quality, extremely detailed, masterpiece, girl, nude, small breasts

开始训练，前几百次迭代还好，越到后面画风约跑偏，图像越模糊，完全无法辨认，更不要提我想要的特征了

前1000次迭代，画风还好，细节精细，但没有目标特征

接近3000次的时候，糊成一坨，完全没有细节，更不要提特征

为了和谐，图模糊了，所以看起来似乎还好，但实际上贼烂，求各路大神分享经验

knlee · 发表于 2023-4-6 19:45:41

本帖最后由 knlee 于 2023-4-6 19:47 编辑

这破论坛是不是不让发链接啊草
我自己没练过手头的电脑太破了做不了训练不过感觉lora可能更简单一点 embedding的好处是不伤底模画风但是难度就挺大的 100来张可能不是很够
我只是拜托朋友练过一个角色的lora（非a）效果还行但是原作者的铅笔线稿风太强势了会覆盖底模画风
之前gitgud上下的那个a的lora也是嘴脸眼眉的特征过于明显了偏偏又是我讨厌的类型我也不喜欢用而且我本来就不喜欢quad

我朋友说是参照了 b站 BV1Wv4y157NH 的手法练的分层控制就可以比较好的解决画风污染的问题了
而且据说现在用单张原设图的基础上图生图再用生出来的图再训练也能得到很好的lora了实际上c站也有很多高人新练的lora不怎么画风污染

crazy95sun · 发表于 2023-4-6 22:54:48

knlee 发表于 2023-4-6 19:45
这破论坛是不是不让发链接啊草
我自己没练过手头的电脑太破了做不了训练不过感觉lora可能更简单一点 embe ...

看起来还是lora更快一点啊，没接触过，要研究研究

在没有相关特征的情况下要怎么图生图呢？我给AI传一个没腿的，他给我把腿补回来了

crazy95sun · 发表于 2023-4-6 23:10:21

knlee 发表于 2023-4-6 19:45
这破论坛是不是不让发链接啊草
我自己没练过手头的电脑太破了做不了训练不过感觉lora可能更简单一点 embe ...

看了一下b站视频，似乎是因为我在训练时启用了vae，明天禁用再试试

knlee · 发表于 2023-4-6 23:12:21

可以拿别人现成的lora先搞着 gitgud上有两个虽然效果一般也不是不能用我之前也试过先生成非a图片然后对肢体部分做mask然后加载lora用很高的权重进行inpaint
而且我看你的图量应该是够用的
而且单纯做一个quad的lora应该不需要那么多底图如果要加别的种类可能就不好说了但是也可以设计一些不同的提示词分别训练

crazy95sun · 发表于 2023-4-9 17:09:56

knlee 发表于 2023-4-6 23:12
可以拿别人现成的lora先搞着 gitgud上有两个虽然效果一般也不是不能用我之前也试过先生成非a图片然后对肢 ...

果然是vae的问题，禁用之后已经可以正常训练了，目前正在玄学调参中，10张已经可以出一两张能看的样子的了

crazy95sun · 发表于 2023-4-9 22:08:40

分享一下结果，如果违规，请版主单独删除这一条，不要干掉整个帖子

账号		自动登录	找回密码
密码			立即注册

【已解决】AI画图embedding训练不出来，有没有同专业的求教

本帖子中包含更多资源

本帖子中包含更多资源