当前位置: 首页 > article >正文

opencv-利用DeepLabV3+模型进行图像分割去除输入图像的背景

分离图像中的人物和背景通常需要一些先进的图像分割技术。GrabCut是一种常见的方法,但是对于更复杂的场景,可能需要使用深度学习模型。以下是使用深度学习模型(如人像分割模型)的示例代码:

#导入相关的库
import cv2
import numpy as np
import torch
import torchvision.transforms as T
from torchvision.models.segmentation import deeplabv3_resnet101

def remove_background_with_deep_learning(image_path):
    # 读取图像
    image = cv2.imread(image_path)

    # 将图像转换为RGB格式
    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) #将图像从BGR格式转换为RGB格式,因为深度学习模型通常使用RGB。

    # 定义图像预处理和转换
    transform = T.Compose([  #定义了图像的预处理和转换步骤,包括将图像转换为PyTorch张量和标准化。
        T.ToTensor(),  # 将图像转换为PyTorch张量
        T.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),  # 标准化图像
    ])

    # 对图像进行预处理和转换
    input_tensor = transform(image_rgb)
    input_batch = input_tensor.unsqueeze(0)  # 添加一个维度,使其成为批处理的一部分

    # 加载预训练的DeepLabV3模型
    model = deeplabv3_resnet101(pretrained=True)
    model.eval()  # 设置为评估模式,不进行梯度更新

    # 运行模型并获取分割掩模
    with torch.no_grad(): #上下文管理器,用于关闭梯度计算,以提高推断速度。
        output = model(input_batch)['out'][0]#运行模型并获取输出。
    output_predictions = output.argmax(0)  # 获取模型输出中预测类别的索引

    # 将分割结果转换为二进制掩模
    mask = (output_predictions == 15).numpy()  # 在DeepLabV3模型中,15是人物的标签

    # 将原始图像与二进制掩模相乘,去除背景
    result = image * mask[:, :, np.newaxis]

    # 显示结果
    cv2.imshow('Original Image', image)
    cv2.imshow('Removed Background', result)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
# 使用示例
remove_background_with_deep_learning(r"C:\Users\mzd\Desktop\opencv\images.jpg")

在这里插入图片描述
代码解释:
理解代码可能需要一些基本的编程和机器学习知识,以下是逐步解释代码的主要部分:

  1. 导入库: 首先,导入了用于图像处理和深度学习的库,包括OpenCV(cv2)、PyTorch和TorchVision。

  2. 定义函数: remove_background_with_deep_learning 是一个用于去除图像背景的函数。它接受一个图像路径作为参数。

  3. 读取和转换图像: 使用OpenCV读取图像,然后将图像转换为RGB格式。机器学习模型通常使用RGB格式。

  4. 图像预处理和转换: 定义了一系列图像预处理和转换步骤,将图像转换为PyTorch张量并进行标准化。

  5. 加载预训练模型: 使用deeplabv3_resnet101 模型,它是一个预训练的深度学习模型,专门用于图像分割任务。

  6. 运行模型并获取分割掩模: 将预处理后的图像输入到模型中,获取模型输出中的分割掩模。在这里,15是代表人物的类别标签。

  7. 将分割结果转换为二进制掩模: 将模型输出的分割结果转换为二进制掩模,其中值为1的像素表示属于人物的区域。

  8. 去除背景: 将原始图像与二进制掩模相乘,实现去除背景效果。

在这个函数中,将原始图像与二进制掩模相乘的目的是将背景部分置零,从而实现去除背景的效果。这是基于掩模的思想,其中掩模是一个与原始图像大小相同的二维数组,其中元素的值为0或1,用于指示哪些像素应该保留(值为1)或去除(值为0)。
具体流程如下:

  1. mask = (output_predictions == 15).numpy():通过模型的输出,生成一个二进制掩模。在这里,假设标签15对应于人物。掩模中值为1的像素表示人物,值为0的像素表示背景。
  2. result = image * mask[:, :, np.newaxis]:通过将原始图像与二进制掩模相乘,实现了以下效果:
    • 当掩模中对应位置的值为1(人物部分),相乘结果保持原始图像的颜色值;
    • 当掩模中对应位置的值为0(背景部分),相乘结果将对应位置的像素值置零。 这样,通过像素级别的相乘操作,将背景部分的像素值置零,达到了去除背景的效果。最终,result就是去除背景后的图像。

这是一种简单而有效的背景去除方法,尤其在利用深度学习模型进行图像分割的场景中得到了广泛应用。

  1. 显示结果: 使用OpenCV的 imshow 函数显示原始图像和去除背景后的图像。

  2. 使用示例: 调用 remove_background_with_deep_learning 函数,传递图像路径,这里的路径是 'path/to/your/image.jpg'。这是整个程序的入口。


http://www.kler.cn/a/147020.html

相关文章:

  • 大模型训练(2):内存开销
  • 依据正则表达式拦截文本
  • 【“软件工程”基础概念学习】
  • Redis之C语言底层数据结构笔记
  • UE5富文本框学习(用途:A(名字)用刀(图片)击杀B(名字))
  • Nginx的location块相关知识积累(包括常用的正则匹配表达式的介绍)
  • PLC ST语言经典电路之 一键启停 和 时钟脉冲
  • cadence virtuoso simulation文件夹删除
  • 文件元数据批量修改:mp3音频和mp4视频的元数据如何批量修改
  • ARM异常模型
  • 基于51单片机的超声波测距系统【程序+proteus仿真+参考论文+原理图+PCB等16个文件夹资料】
  • Flutter 开发入门文章汇总
  • HNU 练习八 结构体编程题2. 招聘
  • 一对一连接MODBUS转PROFINET网关TS-182技术特点和主要参数
  • 为何要隐藏IP地址?网络上哪些行为需要隐藏IP和更换IP?
  • 某思路等考通一级MSOffice的分析
  • 15:00面试,15:06就出来了,问的问题有点变态。。。
  • 普通表计读数开发思路
  • 使用conan包 - 调试软件包
  • 【Unity程序技巧】加入缓存池存储地图资源,节省资源,避免多次CG
  • 常用Web安全扫描工具合集
  • 关于mybatis插入返回主键id和SpringBoot事务注解自调用演示
  • nodejs+vue+elementui学生竞赛管理系统65o97