python中ocr图片文字识别样例(一)
一、使用easyocr安装依赖
pip install easyocr
pip install opencv-python-headless # 处理图像
二、具体实现,此处有个缺陷,大家可以尝试解决下,识别的文字打印结果没问题,但是图片识别出现乱码:
2.1 具体识别的图片
2.2 代码实现:
我有必要说下这块reader = easyocr.Reader(['ch_sim', 'en'], model_storage_directory='./models', download_enabled=True, gpu=False) ,这块也可以这么写:
reader = easyocr.Reader(['ch_sim', 'en'],gpu=False) 这么写就会每次都下载模型,所以我把模型下载到指定地址,并且如果有gpu则对应gpu的参数可调整成true
# -*- coding: utf-8 -*-
import easyocr
import cv2
import matplotlib.pyplot as plt
# 初始化 OCR reader (这里选择中文和英文)
reader = easyocr.Reader(['ch_sim', 'en'], model_storage_directory='./models', download_enabled=True, gpu=False)
# 读取图像
image_path = 'read_image.png' # 替换成你的图片路径
image = cv2.imread(image_path)
# 识别图像中的文字
result = reader.readtext(image_path)
# 输出识别的结果
for (bbox, text, prob) in result:
print(f"识别结果: {text}, 置信度: {prob:.4f}")
# # 显示识别框和文字
for (bbox, text, prob) in result:
# bbox 是一个包含四个坐标点的数组,定义了文本框
top_left = tuple(map(int, bbox[0]))
bottom_right = tuple(map(int, bbox[2]))
# 在图像上画出识别结果
cv2.rectangle(image, top_left, bottom_right, (0, 255, 0), 2)
cv2.putText(image, text, top_left, cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)
# 显示图片
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
plt.axis('off')
plt.show()