当前位置: 首页 > article >正文

实现了两种不同的图像处理和物体检测方法

这段代码实现了两种不同的图像处理和物体检测方法:一种是基于Canny边缘检测与轮廓分析的方法,另一种是使用TensorFlow加载预训练SSD(Single Shot Multibox Detector)模型进行物体检测。

1. Canny边缘检测与轮廓分析:

首先,通过OpenCV进行图像处理,找到矩形物体并进行绘制:

image = cv2.imread('U:/1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 高斯模糊
blurred = cv2.GaussianBlur(gray, (5, 5), 0)

# Canny边缘检测
edges = cv2.Canny(blurred, 50, 150)

# 查找轮廓
contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

for contour in contours:
    # 逼近多边形
    epsilon = 0.04 * cv2.arcLength(contour, True)
    approx = cv2.approxPolyDP(contour, epsilon, True)

    # 如果轮廓有4个点且是矩形
    if len(approx) == 4:
        # 计算矩形的长宽比
        x, y, w, h = cv2.boundingRect(approx)
        aspect_ratio = float(w) / h
        if 0.8 < aspect_ratio < 1.2:  # 如果长宽比接近1,表示是矩形
            # 绘制矩形
            cv2.drawContours(image, [approx], -1, (0, 255, 0), 2)

# 显示结果
cv2.imshow("Detected Rectangles", image)
cv2.waitKey(0)
cv2.destroyAllWindows()
  • 步骤:
    1. 灰度化:通过cv2.cvtColor()将图像转换为灰度图。
    2. 高斯模糊:使用cv2.GaussianBlur()进行模糊处理,减少噪声。
    3. Canny边缘检测:通过cv2.Canny()检测图像中的边缘。
    4. 查找轮廓:使用cv2.findContours()获取图像的外部轮廓。
    5. 轮廓逼近:通过cv2.approxPolyDP()简化轮廓形状,逼近为多边形。
    6. 筛选矩形:通过检测轮廓点数为4的多边形,计算长宽比并判断其是否接近正方形(长宽比介于0.8和1.2之间)。
    7. 绘制矩形:如果符合条件,使用cv2.drawContours()绘制绿色矩形框。

2. SSD模型物体检测:

接下来,使用TensorFlow加载预训练的SSD模型,并在图像上进行物体检测,最后绘制检测框:

# 加载预训练的SSD模型
model = tf.saved_model.load('ssd_mobilenet_v2_coco/saved_model')

# 读取图片
img = cv2.imread('image_path')
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
input_tensor = tf.convert_to_tensor(img_rgb)
input_tensor = input_tensor[tf.newaxis, ...]  # 扩展维度

# 执行推理
model_fn = model.signatures['serving_default']
output_dict = model_fn(input_tensor)

# 获取检测结果
boxes = output_dict['detection_boxes'].numpy()[0]  # 边界框
scores = output_dict['detection_scores'].numpy()[0]  # 置信度
classes = output_dict['detection_classes'].numpy()[0]  # 标签

# 筛选出矩形
threshold = 0.5
for i in range(len(scores)):
    if scores[i] > threshold:
        y1, x1, y2, x2 = boxes[i]
        x1, y1, x2, y2 = int(x1 * img.shape[1]), int(y1 * img.shape[0]), int(x2 * img.shape[1]), int(y2 * img.shape[0])
        cv2.rectangle(img, (x1, y1), (x2, y2), (0, 255, 0), 2)

# 显示图像
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img_rgb)
plt.axis('off')
plt.show()
  • 步骤:
    1. 加载SSD模型:通过tf.saved_model.load()加载一个预训练的SSD模型(ssd_mobilenet_v2_coco)。
    2. 读取图像:使用cv2.imread()加载图像,并将其转换为RGB格式。
    3. 图像处理:将图像转换为TensorFlow的张量格式,并扩展为批处理维度。
    4. 推理过程:通过模型的signatures['serving_default']执行推理,获得检测的边界框、置信度和标签。
    5. 筛选结果:根据置信度(scores)大于设定的阈值(0.5)进行筛选。
    6. 绘制边界框:使用cv2.rectangle()绘制绿色矩形框,将检测到的物体框出。
    7. 显示图像:使用matplotlib.pyplot显示处理后的图像。

总结:

  • Canny边缘检测与轮廓分析:通过对图像边缘进行检测,使用轮廓分析找出矩形,并通过长宽比进一步筛选目标。
  • SSD物体检测:利用TensorFlow预训练的SSD模型进行物体检测,并在图像中绘制检测到的物体框。

这两种方法可以结合使用,在某些应用中,如检测特定形状(矩形)和使用深度学习检测物体时,互为补充。


http://www.kler.cn/a/405918.html

相关文章:

  • spring-logback引用外部文件
  • 区块链网络示意图;Aura共识和Grandpa共识(BFT共识)
  • 二叉树路径相关算法题|带权路径长度WPL|最长路径长度|直径长度|到叶节点路径|深度|到某节点的路径非递归(C)
  • 蓝桥杯每日真题 - 第17天
  • 面试小结(一)
  • 实际开发中的协变与逆变案例:数据处理流水线
  • 2411rust,实现特征
  • 云计算面试题之六.运维架构篇
  • Java爬虫淘宝详情接口深度解析
  • C# .NET环境下调用ONNX格式YOLOV8模型问题总结
  • 【山大909算法题】2014-T1
  • golang面试题
  • 【YOLOv11改进[Conv]】引入GSConv和VoVGSCSPC模块 + 模型轻量化和保持精度
  • 【数据结构】链表(leetcode)
  • 11.22糖丸比赛题解
  • H.265流媒体播放器EasyPlayer.js网页全终端安防视频流媒体播放器可以播放本地视频吗
  • Linux空口抓包方法
  • 数字图像处理(2):Verilog基础语法
  • 【React】React Router:深入理解前端路由的工作原理
  • 常用的消息中间件
  • Python编程艺术:优雅与实用的完美平衡(推导式)
  • 《OpenCV 图像基础操作全解析:从读取到像素处理与 ROI 应用》
  • hbase mongodb hive starrocks比较
  • 专题十一——栈
  • 17种Kubernetes安全检测工具详解
  • 解决绿盟漏洞扫描 gateway、nacos、springboot tomcat检测到目标主机可能存在缓慢的HTTP拒绝服务攻击问题