[ComfyUI]Flux:写真新篇章!字节PuLID率先开启一致性风格迁移,无损画手和优质画面保持

前言

Flux:PuLID率先开启F1写真新篇章

所有的AI设计工具,模型和插件,都已经整理好了,👇获取~在这里插入图片描述

Flux PuLID简介

在Flux出来后短时间内,社区生态反响和发展足够的迅猛快速。至今为止,社区LORA模型的涌现,Flux底膜数据集缺少问题(特别中文元素)逐步解决。ControlNet可控性方面已有Xlabs和InstantX的几款ControlNet(目前已可用,但画质还有待进一步提升)也在加速训练和完善中。近日字节Pulid团队,在之前SDXL的Pulid版本沉淀基础上,再次出手推出了:PuLID-FLUX-v0.9.0模型发布,为FLUX.1-dev提供了一个无需调整的身份ID一致性和定制化解决方案,风格一致性保持一直是在人物写真、连续多图漫画展示和视频等领域作为核心问题之一。

更多关于PuLID简介文件可以参见之前文章:[SD必备知识系列三:PuLID面部特征一致性风格保持与迁移,轻松搞定私人写真摄影,风格迁移模型评比] 。更多风格一致性系列文章:

  • • [SD必备知识系列四:面部特征保持哪家强?人物一致性定量评估]

  • [•] [SD必备知识系列二:InstantID面部特征一致性风格保持与迁移,轻松搞定私人写真摄影,SDWebUI使用指南]

  • [] [SD必备知识系列一:IPAdapterFaceID面部特征一致性保持与迁移,轻松搞定私人写真摄影,SDWebUI使用指南]

  • 在线体验地址:https://huggingface.co/spaces/yanze/PuLID-FLUX

  • github地址:https://github.com/ToTheBeginning/PuLID

PuLID-FLUX推理

PuLID-FLUX刚出来,当前还未完成ComfyUI插件的支持,目前可以统一本地WebUI方式或在线体验。在线体验地址:https://huggingface.co/spaces/yanze/PuLID-FLUX。

WebUI部署

使用如下命令可实现本地部署体验:

# 环境设置  
# clone PuLID repo  
git clone https://github.com/ToTheBeginning/PuLID.git  
cd PuLID  
# create conda env  
conda create --name pulid python=3.10  
# activate env  
conda activate pulid  
# Install dependent packages  
pip install -r requirements.txt  # 授权模型下载  
!pip install -U huggingface_hub  
!huggingface-cli login  # 服务启动  
# start service  
python app_flux.py

视觉结果展示

实用技巧

有两个关键参数需要仔细设置:

    1. 开始插入ID的时间步:此参数控制ID插入的时机。如果设置为0,则ID从第一个时间步开始被插入到DIT中。越早插入,ID的保真度越高,但可编辑性可能会降低。越晚插入,对ID的忠实度越低,但可编辑性会增加,对原始模型行为的干扰也会更小。对于生成逼真图像,建议将其设置为4。如果发现ID的相似性不够高,可以尝试相应降低此参数。对于生成风格化图像,建议将其设置为0-1。

    1. 真正的CFG比例:FLUX.1-dev是一个指导蒸馏模型。原来的CFG过程,需要双倍的推理步骤,被蒸馏成一个指导比例,从而通过指导比例调制DIT,用一半的推理步骤模拟真正的CFG过程。在文档中将这被称为假CFG。PuLID-FLUX模型可以在假CFG设置下进行测试,指导比例可以设置为常用的值,比如4。然而,该模型也支持使用真正的CFG进行推理。研发团队在下面的逼真场景中比较了使用真正CFG和假CFG的结果。

如上图所示,在ID保真度方面,使用假CFG在大多数情况下与真正的CFG相似,除了在少数情况下,真正的CFG实现了更高的ID相似性。在图像审美和面部自然性方面,假CFG表现更好。然而,通过仔细调整超参数,真正的CFG的性能可能进一步提高。研发团队建议对逼真场景使用假CFG。如果对ID的忠实度不满意,可以尝试切换到真正的CFG。此外,如下图所示,发团队还发现在风格化场景中使用假CFG有时会导致ID相似性降低和风格响应变差,所以如果在风格化场景中遇到这两个问题,请考虑切换到真正的CFG。

3. 研发团队还提到:从MLP结构转向了Transformer结构作为ID编码器。受到Flamingo的启发,每隔几个DIT块插入额外的交叉注意力模块,以使ID特征与DIT图像特征相互作用。在Pulid中使用的加速方法(如SDXL-Lightning)是一种可选的加速技巧,但不是训练PuLID不可或缺的。

Flux PuLID一致性风格体验

在本文中将使用笔者LIBLIB分享的基础Flux文生图出图Pulid WebUI一致性组件出图实现风格保持一致性对比。另外,在体验过程中发觉Pulid实现比同类其他ControlNet模型更加优秀,不会对画面产生影响,保持优质画面同时能够保持Flux优秀画手能力。在下面的演示示例中,Flux直出图将启用不同的LORA测试,但Pulid暂未集成到ComfyUI,因此笔者使用中并未启用LORA效果。

Flux 文生图工作流

关于Flux模型本地ComfyUI工作流体验参见之前文章:[FLUX[续篇]:12B参数23G最大开源文生图模型,Dev版直出惊艳美图欣赏].本文涉及ComfyUI工作流和模型均可在LIBLIBAI上下载或在线运行体验:

  • • FLUX.1哩布在线可运行-黑暗森林工作室:https://www.liblib.art/modelinfo/488cd9d58cd4421b9e8000373d7da123

  • • 工作流-Flux文|图生图+LORA+CN+提示反推一键切换工作流:https://www.liblib.art/modelinfo/782aacd70f604da39e83368c696a02a8

  • Flux Pulid在线体验:https://huggingface.co/spaces/yanze/PuLID-FLUX

输入风格图

(网图侵删)

01. AGI Flux

Flux版本使用了墨幽自拍模型,详情参见:[[ComfyUI]Flux:超赞网图风格,高p高糊的反向真实质感]

a chinese woman holding sign with glowing green text "AGI Flux", Bright sunshine
Flux

Flux Pulid

02. 豪车

Flux版本使用了FLUX–细节质感提升–FLUX DETAILER模型,详情参见:[[ComfyUI]Flux:太赞了!细节质感增强,人物降油光写实,富有电影光线,丰富画面元素]

This is a high-resolution portrait of a modern style, featuring a young woman., In this dynamic display scene, a model stands in front of a beautifully designed high-end sports car with a posture that is both elegant and powerful, perfectly complementing the vehicle she is showcasing. The sports car catches everyone's eye with its streamlined design and dazzling body colors, while the model adds life to the moment with her charm and confidence. The car model wears a simple and fashionable dress that shows her professional image without losing her feminine beauty. Her clothing echoes the colors and designs of the sports car, creating a harmonious yet engaging visual effect. Her hair, gently combed and falling over her shoulders, set off against her delicate makeup, showing her elegance and sophistication. Her eyes are firm and confident, as if telling the story behind the sports car and the speed and passion it represents. She leaned gently in front of the car, one hand touching the front, the other hand drooping. This pose not only shows her familiarity and closeness to the car, but also her professionalism and pursuit of perfect presentation.
Flux

Flux Pulid

03. 厨房

Flux版本使用了墨幽自拍模型和Missa_F.1_花境模型,详情参见:[[ComfyUI]Flux:超赞网图风格,高p高糊的反向真实质感]、[Flux:手机摄影般超真实,真假难辨!Missa花境超逼真写实的庭院艺术,身临其境视觉体验]

d577,hj, Kitchen, beautiful Chinese girl, virtuous, beautiful and generous, The video shows a woman cooking in the kitchen. She is wearing a white shirt and beige apron, and is concentrating on placing food on a wooden cutting board. Her hair is black and falls on her shoulders. A modern kitchen with stainless steel appliances and wooden cabinets can be seen in the background. Various ingredients and kitchenware are placed on the countertop, including green vegetables, sliced meat, and other condiments. The lighting is warm and soft, creating a comfortable atmosphere. The style of the entire video is simple and natural, focusing on the cooking process and the details of preparing food.
Flux

Flux Pulid

04. 阿凡达

Flux版本使用功了AWP-FLLORA模型,详情参见:[[ComfyUI]Flux:超逼真质感!AWPFL极致构图和细节,精致逼真的皮肤和质感,报脸全球TOP榜]

Photography, photo, realistic,Chinese girl,20-old-years, Craft an image inspired by the characters from the movie 'Avatar,' featuring a subject with the distinct blue complexion of the Na'vi. Their skin is detailed with intricate, bioluminescent patterns that glow against the dark backdrop, mirroring the mystical flora of Pandora. The character's pointed ears, a hallmark of the Na'vi, protrude elegantly, and they wear a necklace with beads that seem to absorb the surrounding light. The makeup is designed to resemble the iridescent qualities of the Na'vi, with blue glitter and sparkles enhancing the facial features. The background remains intentionally out of focus, drawing all attention to the subject's vibrant and fantasy-inspired appearance, as if they are a real inhabitant of the alien world depicted in the film.
Flux

Flux Pulid

这里分享给大家一份Adobe大神整理的《AIGC全家桶学习笔记》,相信大家会对AIGC有着更深入、更系统的理解。

有需要的朋友,可以点击下方免费领取!

在这里插入图片描述

AIGC所有方向的学习路线思维导图

这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。如果下面这个学习路线能帮助大家将AI利用到自身工作上去,那么我的使命也就完成了:
在这里插入图片描述

AIGC工具库

AIGC工具库是一个利用人工智能技术来生成应用程序的代码和内容的工具集合,通过使用AIGC工具库,能更加快速,准确的辅助我们学习AIGC
在这里插入图片描述

有需要的朋友,可以点击下方卡片免费领取!

在这里插入图片描述

精品AIGC学习书籍手册

书籍阅读永不过时,阅读AIGC经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验,结合自身案例融会贯通。

在这里插入图片描述

AI绘画视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,科学有趣才能更方便的学习下去。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1534409.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

c++面试-语法糖(一)

c面试-语法糖(一) 1、const关键字的作用?(变量,参数,返回值) 定义常量值:const 可以用于定义常量变量,其值在初始化后不能被修改。 const int MAX_SIZE 100;修饰指针:const 可以修饰指针,表示…

69、Python番外篇:从编程范式看如何学习一门编程语言的精髓

引言 在之前的文章中,我们曾聊过如何学习一门编程语言,当时是从程序的构成的角度来分析、展开的,主要提及了数据的表达 数据的处理,也就是数据结构 算法的内容。这个角度对应到所有编程语言,基本都是适用的。但是&a…

负载均衡:从理论到实践 ---day04

负载均衡 负载均衡1.什么是负载均衡2.负载均衡的分类硬件负载均衡软件负载均衡选择 3.引入负载均衡的好处 第一个Ribbon实例步骤1:步骤2:步骤3:步骤4: 问题1. 负载均衡的主要目标是什么?2. 负载均衡器的作用是什么&…

网络安全 DVWA通关指南 DVWA SQL Injection (Blind SQL盲注)

DVWA SQL Injection (Blind) 文章目录 DVWA SQL Injection (Blind)Low布尔盲注时间盲注sqlmap MediumHighImpossible 参考文献 WEB 安全靶场通关指南 Low 0、分析网页源代码 <?phpif( isset( $_GET[ Submit ] ) ) {// Get input$id $_GET[ id ];// Check database$geti…

鸿蒙HarmonyOS开发:一次开发,多端部署(界面级)天气应用案例

文章目录 一、布局简介二、典型布局场景三、侧边栏 SideBarContainer1、子组件2、属性3、事件 四、案例 天气应用1、UX设计2、实现分析3、主页整体实现4、具体代码 五、运行效果 一、布局简介 布局可以分为自适应布局和响应式布局&#xff0c;二者的介绍如下表所示。 名称简介…

DSLogic 逻辑分析仪的使用-I2C协议

一、I2C IIC-BUS&#xff08;Inter-IntegratedCircuit Bus&#xff09;最早是由PHilip半导体&#xff08;现在被NXP收购&#xff09;于1982年开发。 主要是用来方便微控制器与外围器件的数据传输。 它是一种半双工&#xff0c;由SDA&#xff08;数据&#xff09;和SCL&#xf…

MicroPython 片上psrom的支持,并将多个bin合成为一个bin

前两天在github上下载的MicroPython 版本1.20.0&#xff0c;怎么配置都无法开启片上psrom的支持&#xff0c;折腾了一周&#xff0c;都自我怀疑了&#xff0c;最后更新版本为1.23.0一编译直接就过了。。。下面记录下过的&#xff0c;过程&#xff0c;这边使用的是四线SPI的片上…

我平时是怎么找客户的?今天我的实战技巧,分享给大家

我常用的几个方法 1、利用WhatsApp&#xff0c;找客户的号码&#xff0c;去进行营销 学会这个方法&#xff0c;WhatsApp账号都能被你找到http://mp.weixin.qq.com/s?__bizMzg2MTcxNzAwMg&mid2247498845&idx1&sn039a87d60094cf6c166e2cf5e1f94a69&chksmce106…

【黑神话】无脑过大头怪(幽魂)教程,手残也能打过关!

在《黑神话悟空》这款扣人心弦的动作角色扮演游戏中&#xff0c;玩家将面对众多考验操作与策略的Boss战。其中&#xff0c;大头幽魂作为玩家早期就会遇到的挑战之一&#xff0c;其独特的战斗机制和技能组合&#xff0c;对新手玩家而言无疑是一次不小的考验。今天&#xff0c;就…

【附源码】用Python开发一个音乐下载工具,并打包EXE文件,所有音乐都能搜索下载!

现在听个歌&#xff0c;不是要这就是要那&#xff0c;乱七八糟的&#xff0c;下软件都下不赢。 于是决定加班熬夜来做一个&#xff0c;想怎么听就怎么听&#xff0c;大家自己看到就好&#xff0c;悄悄用&#xff0c;别告诉别人哈~ 好了不闲聊&#xff0c;开整&#xff01; 首先…

Element-ui el-table 全局表格排序

实现效果如下&#xff1a; 一、当页数据排序 如果只想要当前页面排序&#xff0c;只会涉及到前端&#xff0c;只需在<el-table-column>标签上添加 :sortable"true"即可 二、自定义排序 如果想要全局排序&#xff0c;需要自定义排序函数&#xff0c;请求后台排…

如何进行大模型训练和微调?(实战)

1、在项目中&#xff0c;如果prompt和function calling足够好&#xff0c;尽量不要微调&#xff0c;节约成本。 以下是针对function calling的slot&#xff0c;评估准确率&#xff08;识别准确度&#xff09;、召回率&#xff08;全面率&#xff09;&#xff0c;F1值。 从中可以…

System.out源码解读——err 和 out 一起用导致的顺序异常Bug

前言 笔者在写一个小 Demo 的过程中&#xff0c;发现了一个奇怪的问题。问题如下&#xff1a; // 当 flagtrue 时打印 a1 &#xff1b;当 flagfalse 时打印 a2。 public static void main(String[] args) {boolean flag false;for (int i 0; i < 10; i) {if (flag) {Sys…

基于python的宠物信息交流系统---附源码74885

摘 要 在当今社会&#xff0c;随着人们生活质量的提高和对精神健康的追求&#xff0c;宠物已经成为我们生活中不可或缺的伙伴。与家中宠物朝夕相处&#xff0c;我们与宠物之间建立了深厚的情感纽带。然而&#xff0c;宠物也有可能生病&#xff0c;需要接受医疗护理。与人类一样…

如何利用Samba跨平台分享Ubuntu文件夹

1.安装Samba 终端输入sudo apt install samba 2.配置Samba 终端输入sudo vim /etc/samba/smb.conf 打开配置文件 滑动文件到最底下 输入以下内容 [Share] # 要共享的文件夹路径 path /home/xxx/sambashare read only no browsable yes编辑完成后按一下Esc按键后输入:wq回…

动不动就下跪的三星,离开天津了

关注卢松松&#xff0c;会经常给你分享一些我的经验和观点。 三星辉煌岁月已过&#xff0c;万事凋零!如果说IBM、惠普、戴尔、苹果、富士康的离开有点惋惜的话&#xff0c;那三星的离开就是“活该”了。 成立于1993年的天津三星电子有限公司与2024年9月6日注销了&#xff0…

基于JavaWeb开发的java ssm springboot+VUE疫情防疫系统系统前后端分离设计和实现

基于JavaWeb开发的java ssm springbootVUE疫情防疫系统系统前后端分离设计和实现 &#x1f345; 作者主页 网顺技术团队 &#x1f345; 欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; &#x1f345; 文末获取源码联系方式 &#x1f4dd; &#x1f345; 查看下方微信号获取…

MySQL字符集的转换

背景介绍 在使用MySQL过程中&#xff0c;如果字符集配置不当&#xff0c;可能会出现插入失败、数据乱码、 索引失效、数据丢失、查询不到期望结果等一系列使用异常的情况。因此&#xff0c;熟练掌握MySQL字符集和比较规则的配置方法&#xff0c;并在此基础上了解MySQL字符集与…

AMD CMD UMD CommonJs ESM 的历史和区别

这几个东西都是用于定义模块规范的。有些资料会提及到这些概念&#xff0c;不理清楚非常容易困惑。 ESM&#xff08;ES Module&#xff09; 这个实际上我们是最熟悉的&#xff0c;就是ES6的模块功能。出的最晚&#xff0c;因为是官方出品&#xff0c;所以大势所趋&#xff0c…

股价跌破1美元!这家激光雷达上市公司被沃尔沃「拖进」ICU

作为目前前装上车成本最高的传感器之一&#xff0c;绝大部分激光雷达初创公司的表现&#xff0c;令人沮丧。“很多时候&#xff0c;前方似乎有一个美好的未来&#xff0c;但事情并不总是按照预期发展。” 比如&#xff0c;作为曾经美股市值最高&#xff08;曾经巅峰期高达120亿…