一个10k stars开源的证件照工具
特别说明:以下内容全部来自官方文档,自测后记录一下
建议:使用conda创建python3.10环境,docker一直拉取失败,建议直接使用项目启动
项目简介
🚀 谢谢你对我们的工作感兴趣。您可能还想查看我们在图像领域的其他成果,欢迎来信:zeyi.lin@swanhub.co.
HivisionIDPhoto 旨在开发一种实用、系统性的证件照智能制作算法。
它利用一套完善的AI模型工作流程,实现对多种用户拍照场景的识别、抠图与证件照生成。
HivisionIDPhoto 可以做到:
- 轻量级抠图(纯离线,仅需 CPU 即可快速推理)
- 根据不同尺寸规格生成不同的标准证件照、六寸排版照
- 支持 纯离线 或 端云 推理
- 美颜(waiting)
- 智能换正装(waiting)
准备工作
环境安装与依赖:
- Python >= 3.7(项目主要测试在 python 3.10)
- OS: Linux, Windows, MacOS
1. 克隆项目
git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
cd HivisionIDPhotos
2. 安装依赖环境
建议 conda 创建一个 python3.10 虚拟环境后,执行以下命令
pip install -r requirements.txt
pip install -r requirements-app.txt
3. 下载权重文件
方式一:脚本下载
python scripts/download_model.py --models all
方式二:直接下载
存到项目的hivision/creator/weights
目录下:
modnet_photographic_portrait_matting.onnx
(24.7MB): MODNet官方权重,下载hivision_modnet.onnx
(24.7MB): 对纯色换底适配性更好的抠图模型,下载rmbg-1.4.onnx
(176.2MB): BRIA AI 开源的抠图模型,下载后重命名为rmbg-1.4.onnx
birefnet-v1-lite.onnx
(224MB): ZhengPeng7 开源的抠图模型,下载后重命名为birefnet-v1-lite.onnx
4. 人脸检测模型配置(可选)
拓展人脸检测模型 | 介绍 | 使用文档 |
---|---|---|
MTCNN | 离线人脸检测模型,高性能CPU推理(毫秒级),为默认模型,检测精度较低 | Clone此项目后直接使用 |
RetinaFace | 离线人脸检测模型,CPU推理速度中等(秒级),精度较高 | 下载后放到hivision/creator/retinaface/weights 目录下 |
Face++ | 旷视推出的在线人脸检测API,检测精度较高,官方文档 | 使用文档 |
5. GPU推理加速(可选)
如需使用英伟达GPU加速推理,在确保你已经安装CUDA与cuDNN后,根据文档找到对应的onnxruntime-gpu
版本安装,如:
# CUDA 12.x, cuDNN 8
pip install onnxruntime-gpu==1.18.0
完成后,调用如birefnet-v1-lite
模型将会利用GPU加速推理。