丹摩征文活动|FLUX.1+ComfyUI的详细部署以及实验总结

公主请阅

  • 1. FLUX.1的简介
  • 2. 部署过程
    • 创建资源
    • ComfyUI的部署操作
    • 部署FLUX.1
  • 如何使用?
    • 实验总结:环境搭建与工具安装
    • 实验步骤
    • 实验结果分析
    • 总结

1. FLUX.1的简介

FLUX.1 是由黑森林实验室开发的图像生成工具,分为三个版本:

  1. FLUX-1-pro(闭源,付费): 最高级别的版本,提供先进的图像生成能力,支持顶级提示词识别、视觉质量、图像细节和输出多样性,目前可通过官方 API 访问,提供企业定制服务。

  2. FLUX-1-dev(开源,但不商用): 与 FLUX-1-pro 接近,提供类似的图像质量和稳定性,适合开发人员学习和实验。

  3. FLUX-1-schnell(开源,用于非商业用户): 面向本地开发和个人使用的轻量级版本,使用 Apache 2.0 许可发布,性能更快,内存占用更小。

FLUX 的图像质量和输出多样性与 Midjourney v6.0、DALL-E 3 等流行模型媲美,拥有极高的成像精度。

在这里插入图片描述


2. 部署过程

创建资源

创建地址
进入控制台-GPU云实例,点击创建实例:
在这里插入图片描述
点击创建实例之后
我们在实例配置中选择付费类型,一般短期需求可以选择按量付费或者包日,长期需求可以选择包月套餐;
然后择GPU数量和需求的GPU型号
这里我选择的是NVIDIA-GeForc-RTX-4090(配置为60GB内存,24GB的显存)
然后配置数据硬盘的大小,每个实例默认附带了50GB的数据硬盘,FLUX.1模型较大,我建议扩容至150GB。

继续选择安装的镜像,丹摩平台提供了一些基础镜像供快速启动,镜像中安装了对应的基础环境和框架,可通过勾选来筛选框架,这里筛选PyTorch,选择PyTorch 2.4.0。

在这里插入图片描述

为保证安全登录,创建密钥对,输入自定义的名称,然后选择自动创建并将创建好的私钥保存的自己电脑中,以便后续本地连接使用。
点击这个创建密钥对
在这里插入图片描述
输入你的自定义密钥名称就行了,点击确定,你的密钥就创建好了
在这里插入图片描述
然后我们选择我们刚刚创建的密钥然后点击立即创建就行了
在这里插入图片描述

稍等几分钟这个实例就创建好了,不要退出下面的页面在这里插入图片描述
点击下面的黄色的字我们就能进入特定的网址进行操作了
在这里插入图片描述
点击进去,然后我们选择这个在这里插入图片描述
这个就相当于一个云服务器,我们在里面输入Linux命令进行一系列的操作
在这里插入图片描述

ComfyUI的部署操作

我们依次在系统中输入以下的命令

# github官方代码仓库
git clone https://github.com/comfyanonymous/ComfyUI.git
# gitCode-github加速计划代码仓库
git clone https://gitcode.com/gh_mirrors/co/ComfyUI.git

输入完成就是下面的样子了
这个命令的作用就是在终端中克隆出仓库存放对应的代码
克隆中,这里会不停的闪烁,我们是不需要进行操作的,等待克隆完成就行了,时间可能很长,但是不要急
在这里插入图片描述
下面就是显示克隆仓库成功了
在这里插入图片描述

然后我们输入第二个命令
克隆完成之后,我们可以看到左边的文件栏是这样的

在这里插入图片描述

然后我们进行后续的操作
我们cd到ComfyUI这个目录执行以下命令,安装ComfyUI需要的依赖:

cd ComfyUI/
pip install -r requirements.txt --ignore-installed

执行以下命令,启动ComfyUI:

python main.py --listen

如果显示下面的成功的样式的话,看到服务成功启动,说明ComfyUI部署成功!
在这里插入图片描述

部署FLUX.1

# 下载完整FLUX.1-dev模型
wget http://file.s3/damodel-openfile/FLUX.1/FLUX.1-dev.tar
# 下载完整FLUX.1-schnell模型
wget http://file.s3/damodel-openfile/FLUX.1/FLUX.1-dev.tar
# 下载完整Clip模型
wget http://file.s3/damodel-openfile/FLUX.1/flux_text_encoders.tar

从上面的命令随便选择一个进行安装就行了,我们选择的是第一个FLUX.1-dev模型
在这里插入图片描述
下载好这个模型之后,我们输入下面的命令进行解压的操作

tar -xf FLUX.1-dev.tar

然后我们可以看到左侧的文件栏的状态
在这里插入图片描述

根据需求我们需要把其中的一些文件移至ComfyUI指定目录:
输入下面的命令进行操作

# 进入解压后的文件夹
cd /root/workspace/FLUX.1-dev
# 移动文件
mv flux1-dev.safetensors /root/workspace/ComfyUI/models/unet/
mv ae.safetensors /root/workspace/ComfyUI/models/vae/

然后我们cd进入JupyterLab根目录
然后下载对应的文件就行了

wget http://file.s3/damodel-openfile/FLUX.1/flux_text_encoders.tar

下载好之后我们输入指令进行解压刚刚下载的文件的操作

tar -xf flux_text_encoders.tar

解压之后目录就是这个样子的
在这里插入图片描述
然后我们仍然需要将文件移至ComfyUI指定目录
执行下面的指令就行了

# 进入解压后的文件夹
cd /root/workspace/flux_text_encoders
# 移动文件
mv clip_l.safetensors /root/workspace/ComfyUI/models/clip/
mv t5xxl_fp16.safetensors /root/workspace/ComfyUI/models/clip/

然后准备部署就准备好了

如何使用?

我们先进入到ComfyUI目录,执行以下命令,启动ComfyUI

cd /root/workspace/ComfyUI
python main.py --listen

我们看到启动成功,host为0.0.0.0,端口为8188:

Starting serverTo see the GUI go to: http://0.0.0.0:8188

我们回到创建实例的地方
点击这个访问控制
在这里插入图片描述
点击添加端口,添加服务对应端口
在这里插入图片描述

然后我们通过链接就能进行访问的操作了
在这里插入图片描述
最后我们导入工作流,然后在ComfyUI中加载或拖动以下图像以获取工作流

下面就是我们的最终效果图片了
在这里插入图片描述

实验总结:环境搭建与工具安装

  1. FLUX环境准备

    • 下载依赖包:根据FLUX的官方文档,下载所需的依赖包,确保Python环境中安装了必要的库,比如torchnumpyPIL等。
    • 环境配置:安装FLUX的核心组件,确保在Python环境中可以正常调用FLUX的接口。
  2. ComfyUI安装与配置

    • 下载和安装:从ComfyUI的官方页面下载最新版本,按照文档指引完成安装。
    • 界面配置:配置ComfyUI的操作界面,调整显示布局,使得各类功能模块便于访问。将FLUX的生成接口集成到ComfyUI界面,以便在图形界面上直接调用。
  3. 数据集准备

    • 导入图像数据:根据实验需要,导入一些样本图像。可以选择日常图片或专门的测试数据,确保数据质量良好,便于实验效果评估。
    • 确认模型文件:下载并加载适用于FLUX的模型文件,确认模型结构和权重加载正确,以便在后续步骤中使用。

实验步骤

  1. 基础设置

    • 启动ComfyUI:启动ComfyUI工具,确保界面正常加载。进入FLUX设置界面。
    • 输入参数配置:在ComfyUI的FLUX界面中,设置图像生成的基础参数,比如分辨率、输出格式等。
    • 选择风格:根据实验需求,选择预设的图像风格(如二次元、写实风格等),或者手动定义特定的图像风格参数。
  2. 模型参数调整

    • 参数选择:进入FLUX模型的参数设置界面,选择不同的生成模型(如高清晰模型或快速生成模型)。
    • 调整渲染细节:设置细节参数,如抗锯齿效果、阴影强度、色彩平衡等,以实现特定的视觉效果。
    • 保存配置:将配置文件保存,以便后续进行同样的参数设置,确保实验结果的一致性。
  3. 代码编写与执行

    • 编写Python代码:编写脚本,调用FLUX API进行图像生成。代码应包括图像加载、参数传递、生成图像等流程。
    • FLUX接口调用:通过FLUX的API接口发送生成请求,将参数传递至模型,并获取生成的图像结果。
    • 代码优化:根据生成结果优化代码逻辑,例如调整循环结构或并行处理,确保在不同参数配置下均能高效运行。
  4. 实验运行与结果观察

    • 执行代码:运行编写的代码,观察生成图像的效果。根据图片内容,判断是否满足预期效果。
    • 结果展示与保存:在ComfyUI中查看生成的图像,对比不同参数下的图像质量,选择较好的效果并保存结果。
    • 记录数据:将生成结果和相应的参数设置记录在实验日志中,便于后续分析和改进。
  5. 优化与调整

    • 参数调整:根据生成结果的效果,对渲染细节进行微调。例如,如果图像细节模糊,可以增加细节参数;如果渲染速度较慢,可以降低分辨率。
    • 重复实验:重新运行调整后的参数设置,观察变化效果。记录每次调整的效果,逐步优化生成图像的质量和速度。
    • 最终配置:确定一套最佳的配置参数,以便日后生成高质量图像。

实验结果分析

  1. 图像质量

    • 在不同参数设置下生成的图像存在显著差异。高分辨率设置能够展示更多的细节,但渲染速度较慢;低分辨率设置的生成速度较快,但细节较少。
    • 对比图像色彩、阴影效果等,记录不同参数下的图像质量差异,找到适合的平衡点。
  2. 渲染速度

    • 观察在不同硬件配置下的渲染速度。高性能显卡对渲染速度有较大提升效果。通过参数调整可以减少渲染时间,但可能会影响图像效果。
    • 记录渲染时间,并计算平均渲染速度,便于后续优化或在不同场景中选择合适的参数。
  3. 图像多样性

    • 在不同参数组合下生成了多样化的图像效果,例如不同风格的图像、多样的视觉表现。
    • 总结参数对图像风格的影响,比如亮度、细节、色彩等方面的变化。通过调整风格参数可以满足多种需求。

总结

本次实验验证了FLUX与ComfyUI结合使用的可行性和效果。生成的图像在细节、色彩和多样性方面表现出色,满足了实验预期。同时,不同参数配置对渲染速度和图像质量有显著影响,通过合理选择参数,可以在质量和速度之间取得平衡。

在未来的应用中,可以继续优化FLUX模型的生成参数,结合更多场景和数据集测试。对于不同应用需求,进一步探索FLUX的生成潜力和在图像生成领域的应用前景。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/13141.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

基于STM32的智能仓库管理系统设计

引言 本项目基于STM32微控制器设计了一个智能仓库管理系统,通过集成多个传感器模块和控制设备,实现对仓库环境和物资管理的自动化监控。该系统能够实时监测仓库内的温湿度、烟雾浓度等参数,并且通过红外传感器监控人员出入,结合R…

206面试题(47~60)

208道Java面试题 47~60 **208道Java面试题****47. 在 Java 程序中怎么保证多线程的运行安全?****48. 多线程中 synchronized 锁升级的原理是什么?****49. 什么是死锁?****50. 怎么防止死锁?****51. ThreadLocal 是什么&#xff1f…

MySQl基础----Linux下数据库的密码和数据库的存储引擎(内附 实操图和手绘图 简单易懂)

绪论​ 涓滴之水可磨损大石,不是由于他力量强大,而是由于昼夜不舍地滴坠。 只有勤奋不懈地努力,才能够获得那些技巧。 ——贝多芬。新开MySQL篇章,本章非常基础,但同时需要一定的Linux基础,所以假若你没学习…

番外篇 | 关于YOLO11算法的改进点总结

前言:Hello大家好,我是小哥谈。在2024年9月27日盛大举行的YOLO Vision 2024活动上,Ultralytics公司震撼发布了YOLO系列的最新成员—YOLO11。作为Ultralytics YOLO系列实时目标检测器的最新迭代,YOLO11凭借尖端的准确性、速度和效率…

增长放缓,跨境电商如何以“体验”撬动高转化和高复购?

增长放缓, 跨境电商步入发展新周期 伴随着疫情红利的逐渐收缩,跨境电商市场从野蛮高速增长回归理性,步入新的发展周期,增幅放缓成为新常态。根据eMarketer的统计数据,全球跨境电商销售增长从2020年的26.7%下跌至2022年…

2024“龙信杯“电子数据取证竞赛——计算机取证题目Writeup

以下内容是2024年“龙信杯”电子数据取证竞赛计算机取证题目的答案与解题思路 前置 前置发现电脑中有EFS加密文件,故使用仿真软件保持原有密码进行仿真 1.分析计算机检材,嫌疑人在将其侵公数据出售前在Pycharm中进行了AES加密,用于加密的key…

Linux学习_12

第十一章 管理Linux软件包和进程 主要包括源码下载安装软件,PRM管理工具,YUM/DNF管理工具 源码下载安装软件 源码文件:是指包含计算机程序源代码的文本文件。源代码是用特定编程语言编写的人类可读指令,它描述了计算机程序的逻辑、…

2024年Python最新下载安装教程,附详细图文,持续更新

大家好,我是Java徐师兄,今天为大家带来的是Python3 的下载安装教程,适用于所有 Python3 版本,感兴趣的可以看一下 文章目录 简介一、Python的下载1 网盘下载地址 (下载速度比较快,推荐)2 官网下载地址 二、…

JAVA同城服务顺风车预约车拼车系统源码支持小程序+公众号+H5

JAVA同城服务顺风车预约车拼车系统源码,全面支持小程序、公众号及H5平台,精准定位于解决城市出行痛点,满足用户多样化、灵活化的出行需求。市场分析显示,该系统凭借便捷的预约拼车功能,有效缓解城市交通压力&#xff0…

126.WEB渗透测试-信息收集-ARL(17)

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 内容参考于: 易锦网校会员专享课 上一个内容:125.WEB渗透测试-信息收集-ARL(16) POC信息里面有一些集成的poc …

什么是 ISP:了解互联网服务提供商的作用

一、ISP 基础知识 从本质上讲,ISP 提供两项主要服务:互联网接入和互联网传输。互联网接入是指使用户能够连接到互联网的物理和逻辑连接,通常通过调制解调器、路由器或其他网络设备。此连接可以是有线的(例如通过 DSL、光纤或电缆…

Trace——下一代自动微分工具,优化AI系统设计

人工智能咨询培训老师叶梓 转载标明出处 在自动化设计和更新AI系统,如编码助手、机器人和副驾驶等领域,优化问题的研究显得尤为重要。传统的自动微分框架,例如PyTorch,虽然能够高效地优化可微分系统,但在面对一般计算…

天猫商品详情数据API接口简介

随着电子商务的飞速发展,各大电商平台都在积极开发和完善自己的数据接口,以便为商家和消费者提供更加便捷、高效的服务。天猫作为阿里巴巴旗下的重要电商平台,其商品详情数据接口是商家获取商品信息、进行数据分析的重要工具。联讯数据将详细…

unity 玩家和炸弹切线计算方式

脚本挂在炸弹上! using System.Collections; using System.Collections.Generic; using UnityEngine;public class TargetDetaction : MonoBehaviour {private Transform PlayerTF;private Transform bomb;private float radius;private string Player "Play…

【Linux】————信号

作者主页: 作者主页 本篇博客专栏:Linux 创作时间 :2024年11月12日 信号和信号量 首先说明这两者之间没有任何关系 信号:信号是在软件层次对中断机制的一种模拟,是一种异步通知机制,用于通知进程发生…

【数据治理】你知道数据加密和脱敏技术?

👉博主介绍: 博主从事应用安全和大数据领域,有8年研发经验,5年面试官经验,Java技术专家,WEB架构师,阿里云专家博主,华为云云享专家,51CTO 专家博主 ⛪️ 个人社区&#x…

python:用 sklearn 构建 K-Means 聚类模型

pip install scikit-learn 或者 直接用 Anaconda3 sklearn 提供了 preprocessing 数据预处理模块、cluster 聚类模型、manifold.TSNE 数据降维模块。 编写 test_sklearn_3.py 如下 # -*- coding: utf-8 -*- """ 使用 sklearn 构建 K-Means 聚类模型 "&…

10款PDF合并工具的使用体验与推荐!!!

在如今的信息洪流中,我们几乎每个人都被淹没在大量的数字文档之中。无论是学生、教师还是职场人士,我们都需要高效地管理和处理这些文档。而PDF文件,凭借其跨平台的稳定性和通用性,成了最常用的文档格式之一。我们经常需要处理、编…

匿名管道 Linux

目录 管道 pipe创建一个管道 让子进程写入,父进程读取 如何把消息发送/写入给父进程 父进程该怎么读取呢 管道本质 结论:管道的特征: 测试管道大小 写端退了,测试结果 测试子进程一直写,父进程读一会就退出 …

【stablediffusion又出王炸】IC-Light,可以操控图像生成时的光照,光照难题终于被解决了!

IC-Light代表Impose Constant Light,是一个控制图像照明的项目。可以操控图像生成时的光照,对内容主体重新打光生成符合新背景环境光照的图片。这下商品图合成这种需要最大程度保持原有主体 ID 需求的最大的问题解决了。 Controlnet, Layerdiffusion, IC-light… …