当前位置: 首页 > article >正文

python pytesseract库,ocr

pytesseract

  • 安装pytesseract-ocr

    mac:

    //先安装依赖库libpng, jpeg, libtiff, leptonica
    brew install leptonica
    
    //安装tesseract的同时安装训练工具
    brew install --with-training-tools tesseract
    
    //安装tesseract的同时安装所有语言,语言包比较大,如果安装的话时间较长,建议不安装,按需选择
    brew install  --all-languages tesseract
    
    //安装tesseract,并安装训练工具和语言
    brew install --all-languages --with-training-tools tesseract 
    
    //只安装tesseract,不安装训练工具
    brew install  tesseract
    

    win:

    安装包地址:https://github.com/UB-Mannheim/tesseract/wiki

    配置环境变量

    安装依赖包:

    pip install pytesseract

    pip install pillow

  • 下载语言库

    chi_sim.traineddata:中文简体

    eng.traineddata:英文

    https://github.com/tesseract-ocr/tessdata

  • 使用

    from PIL import Image
    import pytesseract
    text = pytesseract.image_to_string(Image.open('./eng.png')
                                       ,lang='eng' # 指定语言,chi_sim为简体中文
                                      )
    print(text)
    


http://www.kler.cn/a/466539.html

相关文章:

  • node.js内置模块之---fs 模块
  • 2025 年前端新技术如何塑造未来开发生态?
  • 光缆生产车间可视化,让智能制造更透明
  • Scala 访问修饰符
  • node.js:多线程 简单示例
  • Linux驱动开发(16):输入子系统–电容触摸驱动实验
  • mybatis-plus自动填充时间的配置类实现
  • Time-vulnhub打靶-Chronos
  • Golang的容器化技术深入
  • linux-25 文件管理(三)复制、移动文件,cp,mv
  • Springboot日志打印、SpringBoot集成Log4j2、异步日志
  • 一、数据库 Sqlite3 资料
  • Linux下部署Redis集群 - 一主二从三哨兵模式
  • 计算机网络•自顶向下方法:链路层编址、ARP协议、以太网
  • U盘格式化工具合集:6个免费的U盘格式化工具
  • 【记录】Angr|Angr 标准库函数替换怎么看哪些库函数被Angr支持?
  • Couchbase是不是MPP数据库
  • 学生管理系统springboot+论文源码调试讲解
  • 【Seed-Labs 2.0】Cross-Site Scripting (XSS) Attack Lab (Web Application: Elgg)
  • Python:爬虫基础《爬取红楼梦》
  • Redis Hash哈希
  • 使用Clion在ubuntu上进行交叉编译,并在Linux上远程编译五子棋
  • ABAQUS三维Voronoi晶体几何建模
  • 多台DHCP服务器时的问题讨论
  • Windmill 实战:快速构建自动化工作流和用户界面
  • Windows安装了pnpm后无法在Vscode中使用