docker-compose Install MinerU 0.3 GPU模式
MinerU
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到issue提交问题,同时附上相关PDF。
前提要求
- Linux安装 docker docker-compose 参考
- Windows 10 ,11 2022 docker docker-compose 参考
创建一键部署mineru 自动化脚本
- 以下测试基于GPU模式下进行
- 以下环境在docker容器下运行
- mineru 安装参考官网
- magic-pdf 命令使用参考
- nvidia GPU驱动安装参考
- mineru 对外api 端口8888 可执行更改
vim /mineru_GPU_install.sh
#!/bin/bash
# -*- coding: utf-8 -*-
# Author: CIASM
# update 2025/02/27
# make.han
echo "creation mineru contents"
mkdir -p /opt/mineru
echo "creation mineru docker-compose.yml"
cat <<'EOF'>>/opt/mineru/docker-compose.yml
version: "3.8"
services:
mineru_server:
image: quincyqiang/mineru:0.3-models
container_name: mineru_server
restart: always
ports:
- "8888:8000"
volumes:
- ./mnt/c/mineru_output:/root/output
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: all
capabilities: [gpu]
runtime: nvidia
environment:
- NVIDIA_VISIBLE_DEVICES=all
stdin_open: true
tty: true
EOF
echo "start mineru"
cd /opt/mineru && docker-compose up -d
一键执行安装mineru
bash /mineru_GPU_install.sh
mineru api 接口访问
- http://YOU_ip:8888/docs
- Try it out > pdf_file(上传自己的文件)> Execute(处理完成后点击download)