当前位置: 首页 > article >正文

MiNiGPT4安装记录

装conda

wget https://repo.anaconda.com/archive/Anaconda3-5.3.0-Linux-x86_64.sh
chmod +x Anaconda3-5.3.0-Linux-x86_64.sh
./Anaconda3-5.3.0-Linux-x86_64.sh
export PATH=~/anaconda3/bin:$PATH # 或者写到环境保护变量
# 不会弄看这吧 https://blog.csdn.net/wyf2017/article/details/118676765

下载代码装依赖

git clone https://github.com/Vision-CAIR/MiniGPT-4.git
cd MiniGPT-4
conda env create -f environment.yml
source activate minigpt4

拉模型

apt-get install git-lfs
git lfs install

可选的模型List:

  • V0
git clone https://huggingface.co/lmsys/vicuna-13b-delta-v0  # more powerful, need at least 24G gpu memory
# or
git clone https://huggingface.co/lmsys/vicuna-7b-delta-v0  # smaller, need 12G gpu memory
  • V1
git clone https://huggingface.co/lmsys/vicuna-13b-delta-v1  # more powerful, need at least 24G gpu memory
# or
git clone https://huggingface.co/lmsys/vicuna-7b-delta-v1  # smaller, need 12G gpu memory
  • LLama模型
git clone https://huggingface.co/decapoda-research/llama-13b-hf
# or
git clone https://huggingface.co/decapoda-research/llama-7b-hf

这里后文用的v0,7b的以及llama-7b-hf
所以执行:

# 下载好慢,建议开两个终端一起拉
git clone https://huggingface.co/lmsys/vicuna-7b-delta-v0
git clone https://huggingface.co/decapoda-research/llama-7b-hf

下好了长这样:
在这里插入图片描述
在这里插入图片描述

模型关联

安装关联工具

git clone https://github.com/lm-sys/FastChat.git

# 退回v0.1.10版本,如果是v1的模型,可以不用考虑
cd FastChat
git checkout f34f28cedcb8906fd026f22ec3ef41435a8e24ac

# python3 -m pip install --upgrade pip  # enable PEP 660 support
python3 -m pip install -e .

改个小bug:

vim llama-7b-hf/tokenizer_config.json
# 把下图圈起来的改成LlamaTokenizer

在这里插入图片描述

合并模型:

python3 -m fastchat.model.apply_delta --base ./llama-7b-hf  --target ./vicuna_weight/  --delta ./vicuna-7b-delta-v0

下载minigpt4的权重

谷歌云盘prerained_minigpt4_7b.pth
谷歌云盘pretrained_minigpt4.pth
或者csdn的资源:
csdn

配置权重路径

修改eval_configs/minigpt4_eval.yaml的ckpt字段,改成prerained_minigpt4_7b.pth的路径:
在这里插入图片描述
修改minigpt4/configs/models/minigpt4.yaml的llama_model字段,改成合并模型的权重
在这里插入图片描述

启动

python3 demo.py --cfg-path eval_configs/minigpt4_eval.yaml  --gpu-id 0

可能的报错

httpx.InvalidURL: Invalid port:

解决:csdn

cuda_setup is not defined

解决:pip install bitsandbytes==0.38.1

ImportError: libGL.so.1: cannot open shared object file: No such file or directory

解决:apt-get update && apt-get install -y python3-opencv

RuntimeError: probability tensor contains either inf, nan or element < 0

解决:minigpt4/conversation/conversation.py第155行删除do_sample=True但是这样会导致输出为空…
第二种解决方案需要16GB的显卡资源:如下设置该字段为False即可(错误原因是8bit量化的问题,应该是浮点数截断了导致全0或者全NaN):
在这里插入图片描述


http://www.kler.cn/a/15276.html

相关文章:

  • 每日一练 | 包过滤防火墙的工作原理
  • Springboot 整合 Java DL4J 打造金融风险评估系统
  • MySQL45讲 第二十四讲 MySQL是怎么保证主备一致的?——阅读总结
  • 初识Linux · 信号处理 · 续
  • 【ARM】MDK在debug模式下的Registers窗口包含哪些内容
  • 解决Windows远程桌面 “为安全考虑,已锁定该用户账户,原因是登录尝试或密码更改尝试过多。请稍后片刻再重试,或与系统管理员或技术支持联系“问题
  • 黑盒测试过程中【测试方法】详解5-输入域,输出域,猜错法
  • ERTEC200P-2 PROFINET设备完全开发手册(4-1)
  • 解析Mybaits核心配置文件属性
  • 大数据 | 实验二:文档倒排索引算法实现
  • 前苹果设计总监创办,Humane想用AI+AR界面取代手机
  • 【unity项目实战】3DRPG游戏开发05——动画、画质优化和shader的使用
  • 服装店铺装修有哪些窍门?做好这3点,顾客主动上门
  • 必须要知道的hive调优知识(下)
  • 微服务探索:nuoyi
  • ubuntu18.04 配置zlmediakit 支持ffmpeg转码记录
  • 大模型竞争加剧,国内外 AI 监管进一步升级
  • hive udf, tried to access method org.bouncycastle.math.ec.ECPoint$AbstractFp
  • 如何获取到一个app里所使用的所有图标icon等资源文件
  • 妙记多「我的主页」升级,日历聚合任务待办,为你打造个人时间管理系统⏰
  • 4月19日驱动开发
  • 数据类型决定了计算机的计算速度
  • macOS 13.4Beta 3(22F5049e)发布
  • 结构体指针、数组指针和结构体数组指针
  • electron入门 | 手把手带electron项目初始化
  • 数据结构(数组、链表、栈、队列、树)