当前位置：首页 > article >正文

xml格式化（1）：使用python的xml库实现自闭合标签

article 2025/2/28 23:32:47

前言

最近一段时间一直想要写一个urdf格式化插件。

至于为什么嘛，因为使用sw2urdf插件，导出的urdf，同一标签的内容，是跨行的，这就导致，内容比较乱，而且行数比较多。影响阅读。

因此，自己想写格式化的脚本。

最近就开始分享一些，之前的思考。

正文

import xml.etree.ElementTree as ET


def pretty_print(element, level=0, indent="  "):
    """
    手动格式化 XML 数据，添加缩进并将空元素转换为自闭合标签。
    :param element: XML 元素
    :param level: 当前缩进级别
    :param indent: 缩进字符（默认为两个空格）
    :return: 格式化后的 XML 字符串
    """
    result = ""

    if len(element) == 0:  # 如果没有子元素，即可能是空元素
        if element.text and element.text.strip():  # 如果有文本内容
            result += f"{indent * level}<{element.tag}>{element.text.strip()}</{element.tag}>\n"
        else:
            result += f"{indent * level}<{element.tag} "
            # 如果有属性，添加到标签中
            if element.attrib:
                result += " ".join([f'{key}="{value}"' for key, value in element.attrib.items()])
            result += " />\n"  # 使用自闭合标签形式
    else:
        result += f"{indent * level}<{element.tag}"
        # 如果有属性，添加到标签中
        if element.attrib:
            result += " " + " ".join([f'{key}="{value}"' for key, value in element.attrib.items()])
        result += ">\n"

        # 处理元素的文本内容
        if element.text and element.text.strip():
            result += f"{indent * (level + 1)}{element.text.strip()}\n"

        # 递归处理子元素
        for child in element:
            result += pretty_print(child, level + 1, indent)

        # 处理结束标签
        result += f"{indent * level}</{element.tag}>\n"

    return result


# 读取 XML 文件
file_path = 'test.urdf'  # 请将此路径替换为实际的文件路径
tree = ET.parse(file_path)
root = tree.getroot()

# 直接格式化 root 元素，而不需要创建新的根节点
formatted_xml = pretty_print(root)

# 打印格式化后的 XML
print(formatted_xml)
with open('test_pretty.urdf', 'w') as f:
    f.write(formatted_xml)