必备工具,AI生成证件照,再也不用麻烦他人,电子驾驶证等多种证件照一键生成

最近有一个生成证件照的开源项目很火,今天我们来学习一下。之前我生成证件照都是线下去拍照,线上使用也是各种限制,需要付费或看广告,而且效果也不是很理想,

今天要分享的这个 AI 证件照生成工具可以一键可以生成一寸照、二寸照、教师资格证、国家公务员考试、社保卡、电子驾驶证、各种签证在内的 18 种证件照片,而且可以选择蓝、白、红、黑、深蓝在内的五种背景证件照片。

1

如果这些配置项里面的不满足你的要求,你还可以自定义生成各种样式的照片。

只需要上传自拍照片,就可以生成各种证件照,自动排版,一键打印,同时也提供了一键美白功能:

2

这个就是使用最近火出圈的AI工具:HivisionIDPhotos 来生成的。

3

该工具支持好几种方式去运行,这里我总结一下:

  • 在线Demo,直接运行
  • 通过Docker一键运行,本地使用
  • 本地安装启动
  • 集成到ComfyUI里,利用工作流自定义出图,这个我会重点讲解一下

在线地址

作者提供了线上地址,无需部署,在线直接免费运行。

国内:
https://swanhub.co/ZeYiLin/HivisionIDPhotos/demo
https://modelscope.cn/studios/SwanLab/HivisionIDPhotos

国外:
https://huggingface.co/spaces/TheEeeeLin/HivisionIDPhotos

Docker部署

docker pull linzeyi/hivision_idphotos
docker run -d -p 7860:7860 linzeyi/hivision_idphotos

访问:http://localhost:7860 即可。

如果需要启动后端接口服务则启动如下服务:

docker run -d -p 8080:8080 linzeyi/hivision_idphotos python3 deploy_api.py

本地安装启动

1.下载源码到本地。

git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
cd HivisionIDPhotos

2.安装依赖。

pip install -r requirements.txt
pip install -r requirements-app.txt

3.下载权重文件。

  • 使用脚本下载
python scripts/download_model.py --models all
  • 直接下载放到对应目录

存到项目的 hivision/creator/weights目录下:


1.modnet_photographic_portrait_matting.onnx (24.7MB): MODNet官方权重

下载地址:
https://github.com/Zeyi-Lin/HivisionIDPhotos/releases/download/pretrained-model/modnet_photographic_portrait_matting.onnx

2.hivision_modnet.onnx (24.7MB): 对纯色换底适配性更好的抠图模型

下载地址:
https://github.com/Zeyi-Lin/HivisionIDPhotos/releases/download/pretrained-model/hivision_modnet.onnx

3.rmbg-1.4.onnx (176.2MB): BRIA AI 开源的抠图模型,下载后重命名为rmbg-1.4.onnx

下载地址:
https://huggingface.co/briaai/RMBG-1.4/resolve/main/onnx/model.onnx?download=true

4.birefnet-v1-lite.onnx(224MB): ZhengPeng7 开源的抠图模型,下载后重命名为birefnet-v1-lite.onnx
下载地址:
https://github.com/ZhengPeng7/BiRefNet/releases/download/v1/BiRefNet-general-bb_swin_v1_tiny-epoch_232.onnx

4.人脸检测模型配置(可选)。

拓展人脸检测模型介绍使用文档
MTCNN离线人脸检测模型,高性能CPU推理(毫秒级),为默认模型,检测精度较低Clone此项目后直接使用
RetinaFace离线人脸检测模型,CPU推理速度中等(秒级),精度较高下载后放到hivision/creator/retinaface/weights目录下
Face++旷视推出的在线人脸检测API,检测精度较高,官方文档使用文档

5.GPU推理加速(可选)。

在当前版本,可被英伟达GPU加速的模型为birefnet-v1-lite,并请确保你有16GB左右的显存。

如需使用英伟达GPU加速推理,在确保你已经安装CUDA与cuDNN后,根据onnxruntime-gpu文档找到对应的onnxruntime-gpu版本安装,以及根据pytorch官网找到对应的torch版本安装。

# 假如你的电脑安装的是CUDA 12.x, cuDNN 8
# 安装torch是可选的,如果你始终配置不好cuDNN,那么试试安装torch
pip install onnxruntime-gpu==1.18.0
pip install torch --index-url https://download.pytorch.org/whl/cu121

在上面配置完后,执行如下命令,然后访问:http://localhost:7860 即可。

python app.py

6.API 服务(可选)。

如果需要启动请求 API 服务,则需要执行如下命令

python deploy_api.py

详细请求方式请参考 API 文档,包含以下请求示例:

  • cURL:https://github.com/Zeyi-Lin/HivisionIDPhotos/blob/master/docs/api_CN.md#curl-请求示例
  • Python:https://github.com/Zeyi-Lin/HivisionIDPhotos/blob/master/docs/api_CN.md#python-请求示例
  • Java:https://github.com/Zeyi-Lin/HivisionIDPhotos/blob/master/docs/api_CN.md#java-请求示例
  • Javascript:https://github.com/Zeyi-Lin/HivisionIDPhotos/blob/master/docs/api_CN.md#javascript-请求示例

ComfyUI

插件地址:https://github.com/AIFSH/HivisionIDPhotos-ComfyUI

有 ComfyUI 的小伙伴,只需要在 ComfyUI 管理器搜索:HivisionIDPhotos-ComfyUI 就可以了。当然也可以直接下载到custom_nodes下面。

4

同上面下载权重和模型一样的操作,modnet_photographic_portrait_matting.onnxhivision_modnet.onnxrmbg-1.4.onnxbirefnet-v1-lite.onnx,把文件放到ComfyUI/custom_nodes/HivisionIDPhotos-ComfyUI/hivision/creator/weights目录下面,而RetinaFace下载的模型retinaface-resnet50.onnx放到ComfyUI/custom_nodes/HivisionIDPhotos-ComfyUI/hivision/creator/retinaface/weights下面。

加载工作流,选好配置运行结果如下:

5

节点都比较简单,如ZHHivisionParamsNode节点:

6

第一个选项证件照的尺寸,第二个选项是背景颜色,第三个选项是背景的渲染效果,是纯色,还是上下渐变或者中心渐变。

HivisionNode节点:

7

head_measure_ratio:头部尺寸比例,值越大,头部占据证件照的比例就越大。

8

top_distance:头部到图像顶部的距离,值越大,距离越远。

9

whitening_strength:为美白强度。

AddWaterMarkNode节点为添加文字水印节点。

10

  • text_color:输入颜色编码,默认是白色。
  • text_size:字体的大小。
  • text_opacity:水印的透明度。
  • text_angle:水印的旋转角度。
  • text_space:水印字体间隔。

如我添加“壁虎”文字水印,效果如下:

11

想要新增证件类型,只需要修改HivisionIDPhotos-ComfyUI\hivision\demo\assets以下文件就可以了,CN 后缀的代表中文,按照文件中的格式添加就可以了。

  • 尺寸:修改size_list_CN.csv后再次运行即可,其中第一列为尺寸名,第二列为高度,第三列为宽度。
  • 颜色:修改color_list_CN.csv后再次运行即可,其中第一列为颜色名,第二列为Hex值。

比如我新加类型:自定义配置和紫色。

12

结果如下:

13

至此基本的用法我们学会了,但在ComfyUI中我们就可以组合各种模型和Lora去生成自己想要的头像了。

比如我们可以把自己的头像上传,然后结合模型,生成微调的专属头像,或调整眼睛,鼻子,耳朵等等。

14

同时我们还能对图片进行模糊去噪,放大等。比如我们简单处理后效果如下:

15

文中所使用到的工作流欢迎关注公众号,回复【工作流】获取。

欢迎大家关注微信公众号"壁虎说技术",更多AI新技术,新点子在公众号第一时间更新。

壁虎说技术

参考

HivisionIDPhotos

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/143009.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

深度学习之图像数据集增强(Data Augmentation)

文章目录 一、 数据增强概述二、python实现传统数据增强参考文献 一、 数据增强概述 数据增强(Data Augmentation)是一种技术,通过对现有数据进行各种变换和处理来生成新的训练样本,从而增加数据集的多样性和数量。这些变换可以是…

一文入门生成式AI(理解ChatGPT的原理)

一、什么是生成式AI? 以ChatGPT为代表的生成式AI,是对已有的数据和知识进行向量化的归纳,总结出数据的联合概率。从而在生成内容时,根据用户需求,结合关联字词的概率,生成新的内容。 可以这么联想&#x…

C++对象拷贝时的优化编译

在现代编译器中,当我们在 C中进行对象的拷贝操作时,编译器并非只是机械地执行逐字节的复制。相反,它会进行优化,避免不必要的拷贝构造等等,这种优化包括“返回值优化”(RVO),“拷贝省…

电脑的主板,内存条插多少合适?

首先,不是插满4条内存就是最好的。 内存条插得多,确实可以扩充容量,提升性能。但是有些低端的主板配低端CPU,插满4条内存,稳定性下降。这里的稳定性包括供电,单独的内存供电容量等。此时CPU会通过降低内存…

Weapons Armor PBR Pack 1 - Fantasy RPG 武器护甲游戏模型

武器和护甲包#1有30个武器和护甲,每个对象都有默认外观,大多数都有网格变形和Substance Painter源文件,用于自定义纹理。 无限PBR&我的哲学 Infinity PBR是十几位艺术家的作品,他们都在做自己最擅长的事情。我想为独立游戏开发者制作最通用、最优质的资产,按照我希望的…

大数据新视界 --大数据大厂之数据驱动决策:如何利用大数据提升企业竞争力

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

MySQL之内置函数

目录 一:日期函数 二:字符串函数 三:数学函数 四:其他函数 一:日期函数 举例: (1) mysql> select current_date(); ---------------- | current_date() | ---------------- | 2024-09-17 | ---------------- 1 row …

了解云容器实例云容器实例(Cloud Container Instance)

1.什么是云容器实例? 云容器实例(Cloud Container Instance, CCI)服务提供 Serverless Container(无服务器容器)引擎,让您无需创建和管理服务器集群即可直接运行容器。 Serverless是一种架构理念…

中秋节程序员一般在干啥?

中秋节作为一个传统的中国节日,主要庆祝活动围绕着家庭团聚、赏月、吃月饼等文化习俗展开。然而,对于程序员这个职业群体来说,他们的中秋节活动可能因工作性质和个人安排而有所不同。但大致上,程序员在中秋节期间可能会有以下几种…

SpaceX实现人类首次商业太空行走:航天历史新篇章

导语 2023年9月,SpaceX成功完成了人类历史上首次商业太空行走,这不仅是航天领域的重要突破,也是商业航天的一次重大胜利。这一事件标志着普通人离太空更近了一步,为未来的太空探索和火星移民奠定了基础。 一、背景介绍&#xff1a…

【C++二叉树】102.二叉树的层序遍历

107. 二叉树的层序遍历 II - 力扣(LeetCode) 思路分析: 层序遍历,但是要注意输出的结果是一个二维数组,不是一层一个值一个值的输出,而是要一层一层的输出。可以通过一个循环控制每一层的数据个数&#xff…

2-97 基于matlab的小波变换模量最大值 (WTMM) 方法进行图像边缘检测

基于matlab的小波变换模量最大值 (WTMM) 方法进行图像边缘检测。利用小波基函数的局部化和振荡特性来检测图像中的边缘,沿每个像素的梯度方向搜索局部最大值,保留局部最大值,抑制其他系数,实现边缘检测。程…

C++11(4)

万众瞩目的C11特辑来了&#xff0c;本章将继续讲解C11更新的内容&#xff0c;不过C11的内容也快接近尾声了。 目录 10。lambda表达式 11。lambda捕捉列表[] 捕捉列表说明 lambda捕捉列表实际应用 10。lambda表达式 #include<iostream> using namespace std; #inclu…

安装WINDOWS微软商店已下架的WSL系统,以UBUNTU 16.04 为例

下载WSL系统 方法1&#xff1a;POWERSHELL 用powershell下载 PowerShell Invoke-WebRequest -Uri https://aka.ms/wsl-ubuntu-1604 -OutFile Ubuntu.appx -UseBasicParsing 1 如果下载时间很长&#xff0c;可以这样把进度条关闭&#xff1a; $ProgressPreference Silentl…

iKuai使用及设置流程

iKuai使用及设置流程 iKuai安装步骤 一、配置主机 1.电脑连接ETH0网口 2.ETH1网口连接猫上面的千兆口 3.手动配置pc的IP地址和192.168.1.1./24在同一网段 3.浏览器输入192.168.1.1 admin admin 二、外网设置 1.直接联通电信网络设置 2.点击 网络设置-内外网设置-点击接…

【网络安全】逻辑漏洞之购买商品

未经授权,不得转载。 文章目录 正文正文 电子商务平台的核心功能,即购买商品功能。因为在这个场景下,任何功能错误都有可能对平台产生重大影响,特别是与商品价格和数量有关的问题。 将商品添加到购物车时拦截请求: 请求包的参数: 解码参数后,并没有发现价格相关的参数,…

IDC JAVA语言搭建教程

程序搭建环境&#xff1a;Linux系统CentOS7.6、宝塔、PHP7.2、MySQL5.6&#xff0c;根目录public&#xff0c;伪静态thinkPHP&#xff0c;开启SSL 安装&#xff1a; yum -y install build-essential QQ1594457675 安装&#xff1a;更多依赖包 yum -y install gcc automake …

java编程行业特点

Java编程行业是一个庞大且充满活力的领域&#xff0c;它涵盖了从桌面应用到企业级应用、从Web开发到移动应用、从大数据处理到云计算服务的广泛范围。Java作为一种跨平台、面向对象的编程语言&#xff0c;自1995年发布以来&#xff0c;一直受到全球开发者的青睐&#xff0c;并在…

【网络安全】Google Dorks+Wayback Machine实现敏感数据泄露

未经许可,不得转载。 文章目录 正文正文 Dork搜索: site: privateprogram.com/webapp/经后续挖掘,我发现了一个专门用于存储用户订单的子域和其中一条链接: https://orders.privateprogram.com/webapp/wcs/stores/servlet/OrderView?orderId=002233893但是访问后返回错…

Qt优秀开源项目之二十三:QSimpleUpdater

QSimpleUpdater是开源的自动升级模块&#xff0c;用于检测、下载和安装更新。 github地址&#xff1a;https://github.com/alex-spataru/QSimpleUpdater QSimpleUpdater目前Star不多&#xff08;911个&#xff09;&#xff0c;但已在很多开源项目看到其身影&#xff0c;比如Not…