当前位置: 首页 > article >正文

labelimg的xml文件转labelme的json文件

文章目录

  • 前言
  • 一、原始数据
  • 二、文件转换
    • 1.xml文件
    • 2.转换代码
  • 三、转换后的结果
  • 总结


前言

labelimg和labelme是计算机视觉领域里非常常用的两款标注软件,然后,有时候我们会遇到需要转换标注文件的情况(其实是用惯了某款软件),为防止自己的脚本找不到,所以本篇文章用来记录将labelimg的xml标注文件转换成labelme的json文件。


一、原始数据

原始数据摆放如下:
在这里插入图片描述
其中,annotations里放的就是我们xml标注文件,jpegimages存放的即是我们的图片文件,标注结果可视化为:
在这里插入图片描述

二、文件转换

1.xml文件

正常情况下,xml标注文件里的内容如下:
在这里插入图片描述

所以,我们只需要读取文件后,通过xml.etree.ElementTree来解析内容即可。

2.转换代码

转换代码如下:

import xml.etree.ElementTree as ET
import json,glob,base64,os
from pathlib import Path
import shutil
#解析XML文件
def get_xml_data(xml_path):
    tree = ET.parse(xml_path)
    filename=tree.find("filename").text
    objects=tree.findall("object")
    objects_list=[] #储存目标的信息,格式为{class_name:boxes}
    for object in objects:
        object_dict={}
        class_name=object.find("name").text
        bndbox=object.find("bndbox")
        
        xmin=bndbox.find("xmin").text
        ymin=bndbox.find("ymin").text
        xmax=bndbox.find("xmax").text
        ymax=bndbox.find("ymax").text
        boxes=[xmin,ymin,xmax,ymax]
        object_dict[class_name]=boxes
        objects_list.append(object_dict)
    imgsize=tree.find("size")
    w=imgsize.find("width").text
    h=imgsize.find("height").text
    objects_list.append({"imageWidth":w})
    objects_list.append({"imageHeight":h})
    return {filename:objects_list}

#base64读取图片
def img_base64(imgpath):
    with open(imgpath,"rb") as f:
        base64_str=base64.b64encode(f.read())
    string=bytes.decode(base64_str)
    return string

#生成labelme的json文件
def create_json(xml_data,img_dir,save_dir):
    json_data={}
    json_data["version"]="5.5.0"
    json_data["flags"]={}
    json_data["shapes"]=[]
    for filename,box_data in xml_data.items():
        imgpath=os.path.join(img_dir,filename)
        if not os.path.exists(imgpath):
            print(f"{imgpath} not exists")
            break

        json_data["imagePath"]=filename
        for objects in box_data:
            if "imageWidth" in objects:
                json_data["imageWidth"]=int(objects["imageWidth"])
                continue
            if "imageHeight" in objects:
                json_data["imageHeight"]=int(objects["imageHeight"])
                continue

            object_dict={"group_id":None}
            object_dict["description"]=""
            object_dict["shape_type"]="rectangle"
            object_dict["flags"]={}

            for class_name,box in objects.items():
                object_dict["label"]=class_name
                object_dict["points"]=[[int(box[0]),int(box[1])],[int(box[2]),int(box[3])]]
            json_data["shapes"].append(object_dict)
    


        imgpath=os.path.join(img_dir,filename)
        json_data["imageData"]=img_base64(imgpath)
        json_name=Path(filename).stem+".json"
        print(json_name)
    
        save_json_path=os.path.join(save_dir,json_name)
        json.dump(json_data,open(save_json_path,"w"),indent=4)
        save_img_path=os.path.join(save_dir,filename)
        shutil.copy(imgpath,save_img_path)

if __name__ == '__main__':
    xml_dir=r"xxx/Annotations"
    img_dir=r"xxx/JPEGImages"
    save_dir=os.path.join(xml_dir,"../json")
    os.makedirs(save_dir,exist_ok=True)
    xml_list=glob.glob(xml_dir+os.sep+"*.xml")
    for xml_path in xml_list:
        print(xml_path)
        xml_data=get_xml_data(xml_path)
        print(xml_data)
        create_json(xml_data,img_dir,save_dir)


代码执行完成后会在我们jpegimages的统计目录下生成json文件夹,里面储存了图片及对应的json文件,如下:
在这里插入图片描述

三、转换后的结果

转换后的结果如下:
在这里插入图片描述


总结

以上,就是本篇文章的所有内容,如有问题,欢迎评论区交流。


http://www.kler.cn/a/551967.html

相关文章:

  • Android ListPreference使用
  • 图床 PicGo+GitHub+Typora的下载安装与使用
  • 基于 Spring Cloud + Sentinel 的全面流量治理方案
  • fatal: Out of memory, malloc failed (tried to allocate 524288000 bytes)
  • 《DeepSeek 一站式工作生活 AI 助手》
  • 提升接口性能之缓存
  • Spring Boot项目的基本设计步骤和相关要点介绍
  • Win10环境使用零讯ZeroNews内网穿透实现Deepseek对外服务
  • UDP
  • 全平台搭载旭日5!科沃斯GOAT智能割草机器人全新系列正式开售
  • 轻松搭建本地大语言模型(一)Ollama安装与使用
  • 山石网科×阿里云通义灵码,开启研发“AI智造”新时代
  • 记一次Ngnix配置
  • 智能合约与区块链中的NLP应用:自动化法律文书分析与合同审查【附核心实战代码】
  • 【UE5 C++课程系列笔记】30——自动拷贝DLL及其他资源
  • vue3-03初学vue3中的配置项setup(Composition API (组合API组件中所用到的:数据、方法等,均要配置在setup中)
  • 大模型基础知识快问快答
  • 1、AI量化学习资料 - 用DEEPSEEK玩转PTrade策略开发.zip\AI量化学习资料 - 1、PTrade策略开发提示词(参考模板).md
  • 多线程编程的隐形陷阱:竞态、死锁与活锁的实战解决方案
  • ARM系统源码编译OpenCV 4.10.0(包含opencv_contrib)