当前位置: 首页 > article >正文

python 深度学习 项目调试 图像分割 segment-anything

起因, 目的:

  1. 项目来源: https://github.com/facebookresearch/segment-anything
  2. 项目目的: 图像分割。 提前图片中的某个目标。
  3. facebook 出品, 居然有 47.3k star!

思考一些问题

  1. 我可以用这个项目来做什么?
  2. 给一个图片, 进行分割, 如何提取出自己想要的内容?
  3. 别人用这个项目来做什么?

调试过程:

  1. 下载压缩包。 pip install -e .
  2. pip install opencv-python pycocotools matplotlib onnxruntime onnx
  3. 下载模型。 总共有3个模型。 我选最小的 358 MB
运行示例
  1. 查看 notebooks 里面的3个文件,示例写的很好。
  2. 换成自己的图片,更有趣一些!
  3. 如果图片太大,先进行缩小。 不然内存和显存都不够,很卡!

原始图片:
在这里插入图片描述
简单分割一下:
在这里插入图片描述

画图函数,我修改了示例中的画图函数

这里, take = 10 , 只选取10个即可。
其实,简单的图片, 3个 masks 就够了。

def show_anns(anns, take=10):
    # 检查传入的注释列表是否为空
    if len(anns) == 0:
        return

    # 对注释列表进行排序,按照每个注释的区域大小降序排列
    sorted_anns = sorted(anns, key=(lambda x: x['area']), reverse=True)[:take]

    # 获取当前的轴对象,用于绘图
    ax = plt.gca()
    # 关闭自动缩放,以确保绘制的图像不会因为数据的变化而改变大小
    ax.set_autoscale_on(False)

    # 创建一个全白的图像,其尺寸与第一个注释的分割区域相同
    # 这里假设所有注释的分割区域尺寸是一致的
    img = np.ones((sorted_anns[0]['segmentation'].shape[0], sorted_anns[0]['segmentation'].shape[1], 4))

    # 将图像的 alpha 通道(透明度)设置为 0,表示完全透明
    img[:,:,3] = 0

    # 遍历排序后的注释列表
    for ann in sorted_anns:
        # 获取当前注释的分割区域
        m = ann['segmentation']
        # 为每个注释生成一个随机颜色的遮罩,透明度设置为 0.35
        color_mask = np.concatenate([np.random.random(3), [0.35]])
        # 将遮罩应用到图像上,覆盖对应的分割区域
        img[m] = color_mask

    # 在轴对象上显示图像
    ax.imshow(img)

结论 + todo

图像相关的项目,需要显存。

masks = mask_generator.generate(image) # 运行这一步, gpu 用了 5.6G / 8.7G


老哥留步,支持一下。

请求支持


http://www.kler.cn/news/366919.html

相关文章:

  • Python | Leetcode Python题解之第509题斐波那契数
  • 探秘 MySQL 数据类型的艺术:性能与存储的精妙平衡
  • axure中继器
  • 2.Linux按键驱动-创建字符设备,通过应用程序读取按键值
  • VUE前端按钮添加遮罩层
  • 【ShuQiHere】Linux 系统中的硬盘管理详解:命令与技巧
  • 微信小程序 - 动画(Animation)执行过程 / 实现过程 / 实现方式
  • RabbitMQ 发布确认高级部分
  • 语音交互:重塑人机对话的未来
  • 【Nas】X-Doc:jellyfin“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”问题解决方案
  • 量子计算突破:下一个科技革命的风口浪尖在哪里?
  • Spring Boot 集成 PDFBox 实现PDF电子签章的简单应用
  • AI大模型开发架构设计(16)——ChatGPT Code Interpreter应用场景和技术原理动手实践
  • 【Python爬虫实战】Selenium自动化网页操作入门指南
  • 数据结构------手撕链表(一)【不带头单向非循环】
  • 掌握预测的准确性——使用 VAEneu 和 CRPS 的概率方法
  • PMP–一、二、三模–分类–11.风险管理–机会风险应对策略
  • 【C++笔记】内存管理
  • 实现简道云与企业微信的自动化数据集成
  • [C#][winform]基于yolov8的道路交通事故检测系统C#源码+onnx模型+评估指标曲线+精美GUI界面
  • Java-图书管理系统
  • LeetCode105. 从前序与中序遍历序列构造二叉树(2024秋季每日一题 49)
  • 地磁传感器(学习笔记上)
  • 微信小程序文字转语音播报案例
  • 基于Java SpringBoot和Vue社区医院诊所医疗挂号管理系统设计
  • 【超大数据】数字的拆分——int128数据类型的使用方法