Mineru本地安装要点

Dify技巧

Posted by Guan on June 1, 2025

Mineru本地安装要点

  1. 1
    
    git clone https://github.com/opendatalab/MinerU.git
    
  2. 1
    
    cd MinerU
    
  3. 1
    
    python -m venv .venv
    
  4. 1
    
    .venv\scripts\activate.ps1
    
  5. 1
    
    uv pip install -e .[core] # 安装核心组件,不含GPU加速
    
  6. 修改 magic_pdf.json,将env的cuda修改为cpu
  7. 终端运行:bash mineru -p <源文件地址/文件名.pdf> -o <目标地址> 自动安装解析模型
  8. Docker部署运行:
    • 1
      
      cd .\projects\web-api
      
    • 退出虚拟环境,修改dockerfileapp.pydownload_models.pyentrypoint.sh,在VS Code中将行尾符从CRLF修改为LF(Linux用)
    • 运行:bash docker build -t mineru-api 如果Hugging Face中下载模型时间过长,将会终止报错,请执行如下程序:
      • 打开download_models.py,将模型下载路径修改:
        1
        2
        
        model_dir = snapshot_download(……, local_dir="./models/")
        layoutreader_model_dir = snapshot_download(……, local_dir="./models/layoutreader/")
        
      • 打开Dockerfile,将下载改为拷贝本地文件:
        1
        2
        3
        
        # Copy pre-downloaded models (删除原Run语句)
        COPY models/models /opt/models/
        COPY models/layoutreader /opt/layoutreader/
        
      • 进入虚拟环境中,运行:bash python download_models.py 将模型下载到本地
      • 1
        
        deactivate
        
      • 在第9步配置完Dify后,运行:bash docker build -t mineru-api
    • 启动容器:bash docker run -it -p 17777:8000 mineru-api
  9. 配置Dify环境
    • 进入Dify的env,设置FILES_URL=http://api:5001,将docker-compose.yaml内容相应调整,并打开dify-api容器的ports: 5001:5001外部映射端口
    • 关闭重启Dify
  10. 下载Mineru插件,授信地址为:http://host.docker.internal:5001,类型本地部署,密码不填。


wechat icon