当前位置: 首页 > article >正文

文本字符分割算法尝试

一、基于opencv的分割算法

import cv2
import numpy as np
from matplotlib import pyplot as plt

img = cv2.imread('scratch.png', 0)
# global thresholding
ret1, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# Otsu's thresholding
th2 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
# Otsu's thresholding
# 阈值一定要设为 0 !
ret3, th3 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# plot all the images and their histograms
images = [img, 0, th1, img, 0, th2, img, 0, th3]
titles = [
  'Original Noisy Image', 'Histogram', 'Global Thresholding (v=127)',
  'Original Noisy Image', 'Histogram', "Adaptive Thresholding",
  'Original Noisy Image', 'Histogram', "Otsu's Thresholding"
]
# 这里使用了 pyplot 中画直方图的方法, plt.hist, 要注意的是它的参数是一维数组
# 所以这里使用了( numpy ) ravel 方法,将多维数组转换成一维,也可以使用 flatten 方法
# ndarray.flat 1-D iterator over an array.
# ndarray.flatten 1-D array copy of the elements of an array in row-major order.
for i in range(3):
  plt.subplot(3, 3, i * 3 + 1), plt.imshow(images[i * 3], 'gray')
  plt.title(titles[i * 3]), plt.xticks([]), plt.yticks([])
  plt.subplot(3, 3, i * 3 + 2), plt.hist(images[i * 3].ravel(), 256)
  plt.title(titles[i * 3 + 1]), plt.xticks([]), plt.yticks([])
  plt.subplot(3, 3, i * 3 + 3), plt.imshow(images[i * 3 + 2], 'gray')
  plt.title(titles[i * 3 + 2]), plt.xticks([]), plt.yticks([])
plt.show()

二、基于skimage的分割算法尝试

参考链接:

Niblack and Sauvola Thresholding — skimage 0.24.1rc0.dev0 documentation (scikit-image.org)

 Python图像处理二值化方法实例汇总_python_脚本之家 (jb51.net)

skimage sauvola阈值 (主要用于文本检测)

import matplotlib
import matplotlib.pyplot as plt

from skimage.data import page
from skimage.filters import (threshold_otsu, threshold_niblack,
               threshold_sauvola)


matplotlib.rcParams['font.size'] = 9


image = page()
binary_global = image > threshold_otsu(image)

window_size = 25
thresh_niblack = threshold_niblack(image, window_size=window_size, k=0.8)
thresh_sauvola = threshold_sauvola(image, window_size=window_size)

binary_niblack = image > thresh_niblack
binary_sauvola = image > thresh_sauvola

plt.figure(figsize=(8, 7))
plt.subplot(2, 2, 1)
plt.imshow(image, cmap=plt.cm.gray)
plt.title('Original')
plt.axis('off')

plt.subplot(2, 2, 2)
plt.title('Global Threshold')
plt.imshow(binary_global, cmap=plt.cm.gray)
plt.axis('off')

plt.subplot(2, 2, 3)
plt.imshow(binary_niblack, cmap=plt.cm.gray)
plt.title('Niblack Threshold')
plt.axis('off')

plt.subplot(2, 2, 4)
plt.imshow(binary_sauvola, cmap=plt.cm.gray)
plt.title('Sauvola Threshold')
plt.axis('off')

plt.show()

三、IntegralThreshold(主要用于文本检测)

工程所在链接

GitHub - Liang-yc/IntegralThreshold: Adaptive Thresholding Using the Integral Image.


http://www.kler.cn/a/298297.html

相关文章:

  • 哈希表的底层实现(2)---C++版
  • 时间序列处理方法
  • STM32CubeMx学习笔记——GPIO使用
  • pytorch 梯度算法介绍
  • 绿色医院建的中央空调无线集中控制系统
  • 时钟屏保软件哪个好?安利几款非常棒的时钟屏保软件
  • Git 学习与使用
  • 笔记本电脑桌面删除文件怎么恢复?恢复步骤全解析
  • elementUI table 给表头添加气泡显示(鼠标悬浮显示注释)
  • python 实现matrix exponentiation矩阵求幂算法
  • PyQt---不同版本介绍说明及更新过程
  • CIOE中国光博会&电巢科技即将联办“智能消费电子创新发展论坛”
  • 工程师 - 软盘时代
  • C++(进阶 ) ---模板
  • 以太网和WIFI之间的网络切换脚本(Window环境)
  • 在 Ubuntu 20.04 上安装 Python 3.12:详细教程
  • 用go语言实现树和哈希表算法
  • MATLAB求解微分方程和微分方程组的详细分析
  • Git学习尚硅谷(005 idea集成git)
  • 基于opencv实现双目立体匹配点云距离