AI文生图又有新的人脸一致性插件发布了,这次是强强联合!

发布时间:2024-11-05 16:59  浏览量:1

最近,阿里妈妈发布了基于文生图模型SDXL新的人脸保持插件EcomID,EcomID旨在从单一参考ID图像生成人脸定制化图像,确保在关键点控制下保持强烈的语义一致性。目前已经在HuggingFace下开源:

EcomID结合了PuLID和InstantID的优势,以实现更好的背景一致性、面部关键点控制和更真实的面部表现,同时提高了相似度。EcomID在200万张淘宝图像上进行训练,这些图像的分辨率高,美学评分超过5.5,能够生成与主体高度一致的图像。下面是一些具体的例子:

EcomID可以支持不同的SDXL基础模型,也可以支持不同风格的图像生成,还支持多分辨率图像生成:

EcomID的模型架构如下所示:

主要包括两个部分:

EcomID结合了PuLID的ID-Encoder和交叉注意力组件,并通过对齐损失进行训练。这种方法有效地减少了ID嵌入在交叉注意力部分对文本嵌入的干扰,最小化了对底层模型文本到图像能力的破坏。

InstantID’s IdentityNet Architecture

然后是结合了InstantID的IdentityNet,这里利用一个包含200万张美观的人像图片的数据集,IdentityNet增强了关键点控制,提高了身份一致性和面部真实感。在训练过程中,IP-adapter被冻结,只有IdentityNet被训练。面部标志点被用作条件输入,而面部嵌入通过交叉注意力集成到IdentityNet中。

相比其他的人脸一致性插件,EcomID主要有以下优势:

首先是EcomID可以更好地保持文生图能力,如下图所示:

如上所示,EcomID在保持背景生成能力的同时最小化了风格化,极大地增强了真实感。可视化效果突出了更真实的肖像和改进的背景语义一致性,展示了EcomID在生成真实图像方面的优势。

同时,EcomID提升了脸部控制和一致性,如下所示:

如上所示,EcomID使用关键点作为训练的条件输入,允许对面部位置、大小和方向进行精确调整。这种能力确保了生成的肖像更具可控性,同时进一步提高了面部相似度和图像的整体质量。

而且,目前EcomID的ComfyUI插件已经发布:https://github.com/alimama-creative/SDXL_EcomID_ComfyUI,可以很方便地使用了:

本文,完。觉得本篇文章不错的,记得随手点个赞、收藏和转发三连,感谢感谢~如果想第一时间收到推送,请记得关注我们⭐~

外部推荐