InstantID模型部署教程(insmod原理)
itomcoil 2025-06-18 21:44 5 浏览
一、介绍
InstantID 是由 InstantX 团队、小红书公司和北京大学联合开发的一项前沿技术,旨在实现零样本身份保持生成,仅需单张图像即可支持多种下游任务,可以在几秒钟内实现零样本身份保留生成。
InstantID 以其独特的无需微调方式,为图像生成领域带来了重大突破。仅凭借单一图像,就能精准地实现身份保持生成,这一特性为用户带来了极大的便利。它不仅能够牢牢保持图像的身份信息,确保生成的图像与原始图像在身份特征上高度一致,而且还能实现高质量的图像生成和编辑。
更多详细信息见 github官网。
二、部署过程:
基础环境最低要求说明:
环境名称 | 版本信息1 |
Ubuntu | 22.04.4 LTS |
Cuda | V12.1.105 |
Python | 3.12 |
NVIDIA Corporation | RTX 3090 |
1. 更新基础软件包
查看系统版本信息
# 查看系统版本信息,包括ID(如ubuntu、centos等)、版本号、名称、版本号ID等
cat /etc/os-release
配置 apt 国内源
# 更新软件包列表
apt-get update
这个命令用于更新本地软件包索引。它会从所有配置的源中检索最新的软件包列表信息,但不会安装或升级任何软件包。这是安装新软件包或进行软件包升级之前的推荐步骤,因为它确保了您获取的是最新版本的软件包。
# 安装 Vim 编辑器
apt-get install -y vim
这个命令用于安装 Vim 文本编辑器。-y 选项表示自动回答所有的提示为“是”,这样在安装过程中就不需要手动确认。Vim 是一个非常强大的文本编辑器,广泛用于编程和配置文件的编辑。
为了安全起见,先备份当前的 sources.list 文件之后,再进行修改:
# 备份现有的软件源列表
cp /etc/apt/sources.list /etc/apt/sources.list.bak
这个命令将当前的 sources.list 文件复制为一个名为 sources.list.bak 的备份文件。因为编辑 sources.list 文件时可能会出错,导致无法安装或更新软件包。有了备份,如果出现问题,您可以轻松地恢复原始的文件。
# 编辑软件源列表文件
vim /etc/apt/sources.list
这个命令使用 Vim 编辑器打开 sources.list 文件,以便您可以编辑它。这个文件包含了 APT(Advanced Package Tool)用于安装和更新软件包的软件源列表。通过编辑这个文件,您可以添加新的软件源、更改现有软件源的优先级或禁用某些软件源。
在 Vim 中,您可以使用方向键来移动光标,
i 键进入插入模式(可以开始编辑文本),
Esc 键退出插入模式,
:wq 命令保存更改并退出 Vim,
:q! 命令不保存更改并退出 Vim。
编辑 sources.list 文件时,请确保您了解自己在做什么,特别是如果您正在添加新的软件源,因为错误的源可能会导致软件包安装失败或系统安全问题。如果您不确定,最好先搜索并找到可靠的源信息,或者咨询有经验的 Linux 用户。
使用 Vim 编辑器打开 sources.list 文件,复制以下代码替换 sources.list里面的全部代码,配置 apt 国内阿里源。
deb http://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ jammy-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ jammy-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ jammy-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ jammy-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ jammy-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ jammy-backports main restricted universe multiverse
安装常用软件和工具
# 更新源列表,输入以下命令:
apt-get update
# 更新系统软件包,输入以下命令:
apt-get upgrade
# 安装常用软件和工具,输入以下命令:
apt-get -y install vim wget git git-lfs unzip lsof net-tools gcc cmake build-essential
出现以下页面,说明国内apt源已替换成功,且能正常安装apt软件和工具
2. 安装 NVIDIA CUDA Toolkit 12.1
- 下载 CUDA Keyring :
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.0-1_all.deb
这个命令用于下载 CUDA 的 GPG 密钥环,它用于验证 CUDA 软件包的签名。这是确保软件包安全性的一个重要步骤。
- 安装 CUDA Keyring :
dpkg -i cuda-keyring_1.0-1_all.deb
使用 dpkg 安装下载的密钥环,以便 apt 能够验证从 NVIDIA 仓库下载的软件包的签名。
- 删除旧的 apt 密钥(如果必要) :
apt-key del 7fa2af80
这一步可能不是必需的,除非您知道 7fa2af80 是与 CUDA 相关的旧密钥,并且您想从系统中删除它以避免混淆。通常情况下,如果您只是安装 CUDA 并使用 NVIDIA 提供的最新密钥环,这一步可以跳过。
- 更新 apt 包列表 :
apt-get update
更新 apt 的软件包列表,以便包括刚刚通过 cuda-keyring 添加的 NVIDIA 仓库中的软件包。
- 安装 CUDA Toolkit :
apt-get -y install cuda-toolkit-12-1
出现以下页面,说明 NVIDIA CUDA Toolkit 12.1 安装成功
注意:这里可能有一个问题。NVIDIA 官方 Ubuntu 仓库中可能不包含直接名为 cuda-toolkit-12-1 的包。通常,您会安装一个名为 cuda 或 cuda-12-1 的元包,它会作为依赖项拉入 CUDA Toolkit 的所有组件。请检查 NVIDIA 的官方文档或仓库,以确认正确的包名。
如果您正在寻找安装特定版本的 CUDA Toolkit,您可能需要安装类似 cuda-12-1 的包(如果可用),或者从 NVIDIA 的官方网站下载 CUDA Toolkit 的 .run 安装程序进行手动安装。
请确保您查看 NVIDIA 的官方文档或 Ubuntu 的 NVIDIA CUDA 仓库以获取最准确的包名和安装指令。
- 出现以上情况,需要配置 NVIDIA CUDA Toolkit 12.1 系统环境变量
编辑 ~/.bashrc 文件
# 编辑 ~/.bashrc 文件
vim ~/.bashrc
插入以下环境变量
# 插入以下环境变量
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
激活 ~/.bashrc 文件
# 激活 ~/.bashrc 文件
source ~/.bashrc
查看cuda系统环境变量
which nvcc
nvcc -V
3. 安装 Miniconda:
- 下载 Miniconda 安装脚本 :使用 wget 命令从 Anaconda 的官方仓库下载 Miniconda 的安装脚本。Miniconda 是一个更小的 Anaconda 发行版,包含了 Anaconda 的核心组件,用于安装和管理 Python 包。
- 运行 Miniconda 安装脚本 :使用 bash 命令运行下载的 Miniconda 安装脚本。这将启动 Miniconda 的安装过程。
# 下载 Miniconda 安装脚本
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 运行 Miniconda 安装脚本
bash Miniconda3-latest-Linux-x86_64.sh
# 初次安装需要激活 base 环境
source ~/.bashrc
按下回车键(enter)
输入yes
输入yes
安装成功如下图所示
pip配置清华源加速
# 编辑 /etc/pip.conf 文件
vim /etc/pip.conf
加入以下代码
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
注意事项:
- 请确保您的系统是 Linux x86_64 架构,因为下载的 Miniconda 版本是为该架构设计的。
- 在运行安装脚本之前,您可能需要使用 chmod +x Miniconda3-latest-Linux-x86_64.sh 命令给予脚本执行权限。
- 安装过程中,您将被提示是否同意许可协议,以及是否将 Miniconda 初始化。通常选择 "yes" 以完成安装和初始化。
- 安装完成后,您可以使用 conda 命令来管理 Python 环境和包。
- 如果链接无法访问或解析失败,可能是因为网络问题或链接本身的问题。请检查网络连接,并确保链接是最新的和有效的。如果问题依旧,请访问 Anaconda 的官方网站获取最新的下载链接。
4. 从github 仓库克隆项目
- 克隆存储库:
# 克隆 InstantID 项目
git clone https://github.com/InstantID/InstantID.git
如果 github 无法访问,使用 国内镜像 进行克隆
# 克隆 InstantID 项目
git clone https://gitee.com/empty-snow/InstantID.git
出现以上页面即是克隆项目成功!
请注意,如果 git clone https://github.com/InstantID/InstantID.git 这个链接不存在或者无效,git clone 命令将不会成功克隆项目,并且会报错。确保链接是有效的,并且您有足够的权限访问该存储库。
5. 创建虚拟环境
# 创建一个名为 InstantID 的新虚拟环境,并指定 Python 版本为 3.12
conda create -n InstantID python=3.12
6. 安装模型依赖库
- 切换到项目目录、激活虚拟环境、安装依赖
# 切换到 InstantID 项目工作目录
cd InstantID
# 激活 InstantID 虚拟环境
conda activate InstantID
# 安装 requirements.txt 依赖
pip install -r gradio_demo/requirements.txt
出现以上报错,需要修改 requirements.txt 文件
vim gradio_demo/requirements.txt
整体替换为:
diffusers
torch
torchvision
transformers
accelerate
safetensors
einops
onnxruntime-gpu
spaces
omegaconf
peft
huggingface-hub
opencv-python
insightface
gradio
controlnet_aux
gdown
peft
再次执行安装代码:
# 切换到 InstantID 项目工作目录
cd InstantID
# 激活 InstantID 虚拟环境
conda activate InstantID
# 安装 requirements.txt 依赖
pip install -r gradio_demo/requirements.txt
- 依赖安装成功如下图所示:
7. 下载预训练模型
- 执行下载模型脚本:
python gradio_demo/download_models.py
无法访问 Hugging Face 官网,需要进入 HF Mirror 进行模型搜索、下载:
# 下载模型
git lfs install
git clone https://hf-mirror.com/InstantX/InstantID checkpoints
- 模型下载完成的截图:
8. 运行 app.py 文件
# 切换到 InstantID 项目工作目录
cd InstantID
# 激活 InstantID 虚拟环境
conda activate InstantID
# 运行 app.py 文件
python gradio_demo/app.py
github官网下载较慢,直接在本地下载,再上传到服务器(可以使用Xshell等工具进行上传)
https://drive.usercontent.google.com/download?id=18wEUfMNohBJ4K3Ly5wpTejPfDzp-8fI8&export=download
# 进入 models/ 目录
cd /InstantID/models/
# 解压缩 antelopev2.zip 文件
unzip antelopev2.zip
再次运行 app.py 文件
# 切换到 InstantID 项目工作目录
cd /InstantID
# 激活 InstantID 虚拟环境
conda activate InstantID
# 运行 app.py 文件
python gradio_demo/app.py
在运行过程中,出现以上报错,需要进入 Hugging Face 官网,如果 Hugging Face 官网无法访问,则需要进入 HF Mirror 国内加速进行wangqixun/YamerMIX_v8 模型搜索、下载:
# 下载 wangqixun/YamerMIX_v8 模型
git lfs install
git clone https://hf-mirror.com/wangqixun/YamerMIX_v8 wangqixun/YamerMIX_v8
下载完成的页面:
再次运行 app.py 文件
# 切换到 InstantID 项目工作目录
cd /InstantID
# 激活 InstantID 虚拟环境
conda activate InstantID
# 运行 app.py 文件
python gradio_demo/app.py
再次运行的过程中,出现以上报错,需要进入 Hugging Face 官网,如果 Hugging Face 官网无法访问,则需要进入 HF Mirror 国内加速进行latent-consistency/lcm-lora-sdxl 模型搜索、下载:
# 下载 latent-consistency/lcm-lora-sdxl 模型
git lfs install
git clone https://hf-mirror.com/latent-consistency/lcm-lora-sdxl latent-consistency/lcm-lora-sdxl
再次运行 app.py 文件
# 切换到 InstantID 项目工作目录
cd /InstantID
# 激活 InstantID 虚拟环境
conda activate InstantID
# 运行 app.py 文件
python gradio_demo/app.py
出现以上访问链接,则代表模型已经部署成功,现在还需要修改访问IP和端口号:
# 切换到 InstantID 项目工作目录
cd /InstantID
# 激活 InstantID 虚拟环境
conda activate InstantID
# 设置 Gradio 服务器名称和端口
export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080
# 运行 app.py 文件
python gradio_demo/app.py
最终的本地访问链接
最后出现以下 gradio 页面,即是模型已搭建完成。
三、网页演示
相关推荐
- 基于Python开发的家居用品外贸网站(B2B企业官网)
-
作为一名程序员,平时除了本职工作,我也会利用业余时间做一些兼职和副业,大部分的私活都是从某鱼和CSDN接的,有些是别人介绍的。最近刚好接到了一个外贸企业网站的开发需求,客户是一家位于深圳的家居用品公司...
- 摄像头视频流处理方法总结,如何掌握视频流处理技巧?
-
摄像头视频流处理是指其技术本质、关键处理流程和核心目标。1.视频流的定义视频流(VideoStream)是摄像头连续采集图像帧(frame),并以压缩编码格式(如H.264/H.265)传输或存储...
- 大学生机器人开发辅导|代码、机构到控制全链路进阶
-
想做机器人项目,却苦于不会硬件、算法和代码?SRTP、大创、全国竞赛动手项目无从下手?Arduino、STM32、RaspberryPi模块让你头大?想在毕业设计、创新实践、社团活动做出有亮点的机器...
- OpenCV实现手势音量控制(opencv按钮)
-
前言:Hello大家好,我是Dream。今天来学习一下如何使用OpenCV实现手势音量控制,欢迎大家一起前来探讨学习~一、需要的库及功能介绍本次实验需要使用OpenCV和mediapipe库进行手...
- DIY激光枪薄纱蟑螂!AI杀蚊子博士新作,项目已开源
-
萧箫发自凹非寺量子位|公众号QbitAI几个世纪来,人类都处在被蟑螂支配的恐惧中。但比蟑螂更恐怖的,是打不死还消失了的蟑螂……现在,一位博士搞出了一套自动识别并薄(爆)纱(杀)蟑螂的激光“炮...
- 为了杀蚊子,这位博士用树莓派DIY了一把激光枪
-
金磊发自凹非寺量子位报道|公众号QbitAI世人苦蚊子久矣。尤其在夏夜,耳边嗡嗡作响,甚至还得与其“挑灯夜战”个三百回合。为此,一个国外博士便DIY了一种高端的杀蚊方式:计算机视觉精准定...
- 草根PLC革命:低价魔改开源方案对决高价LabVIEW工业视觉系统!
-
魔改方案:三菱FX5U+树莓派魔改架构硬件清单创新设计:双核协同架构:PLC负责实时控制+树莓派运行AI算法EtherCAT菊花链:省交换机成本,布线效率提升70%五大开源工具:CODESYSR...
- 机器人开发进阶:看懂这五个项目中的软硬件哲学
-
DIY机器人项目正逐渐成为技术爱好者和创客们的热门选择。无论是用于教育、娱乐还是实际应用,机器人技术都展现了其强大的潜力。本文将介绍五个EEWorld上备受工程师关注的五个DIY项目,通过本文,您将深...
- 树莓派到底是什么?能干什么?有必要买吗?
-
很多人疑惑,树莓派到底是什么?能干什么?有必要买吗?今天我带着这三个疑惑给大家解答;一、树莓派到底是什么?树莓派通俗的理解就是一台便携式小型电脑,起码最新的树莓派4当一台电脑是可以的;往深了说,他可以...
- 用腾讯优图AI视觉模组做一个驾驶疲劳监测仪
-
道路千万条,安全第一条,相信每个人都是牢记于心的,“喝酒不开车,开车不喝酒”其实不难,难的是防范始料未及的事件,疲倦就是众多始料未及事件中,杀伤力稳居前排的,前一秒心里还在想坚持坚持,下一秒可能就失去...
- Z410升级树莓派4B机型终于和大家见面了
-
*Z410-4B入门二次开发平台*经过近1年的反复测试,Z410升级树莓派4B的机型终于和大家见面了!Z410机型设计的初衷,就是想为大家提供一款基础的、开源的、高性价比、可扩展、可进行二次开发的无人...
- 有保险柜怕不安全,用树莓派制作一款只有刷脸才能开的保险柜吧
-
眨眨眼睛就能保住身家,好过记住密码或拿着钥匙,你的脸就是保险柜的钥匙!这个作品将展示给大家如何用树莓派和摄像头制作一个人脸识别的保险柜,当然,如果不慎毁容或整容,不好意思。。。直接拿锤子砸了吧软件部分...
- 项目分享|仅需1板卡+1摄像头,3步完成人脸喜怒哀乐识别
-
使用OpenCV、TensorFlow和Keras,基于RaspberryPi进行情绪识别,你的心情一览无余。面部表情识别系统可用于多种应用,可以用来研究或分析人的情绪。许多公司正在植入...
- 价值8美元的OpenAsk收费问题回答:孩子小学五年级如何入门编程?
-
从今天起,给大家持续更新OpenAsk上的一些收费问题的回答系列,内容信不信由你,但是如果您仔细看了分析后会说,真香。#少儿编程是智商税吗#“更多内容欢迎关注-司马南柯一梦”(欢迎随意转发)下面是一位...
- 再见 Pycharm,这款开箱即用的轻量级神器你值得拥有
-
作者:豆豆来源:Python技术如果你问我最好用的IDE是什么,那我肯定会毫不犹豫的告诉你Pycharm。毕竟jetbrains出品必属精品。但对于很多初学者来讲,Pycharm显得略笨...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)