当前位置: 首页 > article >正文

【SDL Trados Studio】sdltm格式转excel

思路

1.sdltm转tmx(SDL Trados Studio)

2.tmx转excel(代码/Xbench/Maxprograms/Localazy)

步骤

1.利用SDL Trados Studio打开sdltm文件

2.将选择要导出的翻译库,右键导出

3.查看tmx文件,发现tmx文件符合xml文件格式

4.利用python将tmx文件转为excel文件

代码

import pandas as pd
import xml.etree.ElementTree as ET
def get_text_for_tag(root):
    texts = []
    for element in root.iter():
        if element.text:
            texts.append(element.text)
        if element.tail and element.tail != "\n      ":
            texts.append(element.tail)
    return ''.join(texts)
def tmx_to_excel(tmx_file, excel_file):
    tree = ET.parse(tmx_file)
    root = tree.getroot()
    # 初始化数据列表
    data = []
    # 遍历TMX文件中的每个tu(翻译单元)
    for tu in root.findall('.//tu'):
        seglist = tu.findall("tuv/seg")
        source_text = get_text_for_tag(seglist[0])
        target_text = get_text_for_tag(seglist[1])
        data.append([source_text, target_text])
    # 创建DataFrame
    df = pd.DataFrame(data, columns=['Source', 'Target'])
    # 导出为Excel文件
    df.to_excel(excel_file, index=False)
# 使用示例
tmx_to_excel(r'tmx文件路径', r'xlsx文件路径')

结果


http://www.kler.cn/a/391098.html

相关文章:

  • HTTP Cookie深入解析:Web会话追踪
  • 在 Service Worker 中caches.put() 和 caches.add()/caches.addAll() 方法他们之间的区别
  • 校园服务平台小程序ssm+论文源码调试讲解
  • 力扣 653. 两数之和 IV 二叉树/binary-tree two-sum IV
  • Python 如何根据给定模型计算权值
  • Scala中的case class
  • 在配置环境变量之后使用Maven报错 : mvn : 无法将“mvn”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。
  • 【PowerHarmony】电鸿蒙学习记录-准备工作
  • HarmonyOS开发 API 13发布首个Beta版本,解决了哪些问题?
  • java/SpingBoot
  • 数据仓库还是数据集市?这俩怎么选?
  • 图文组合-pytorch实现
  • 使用 Regex 在 Java 中使用 Logstash LogBack 屏蔽日志
  • 群控系统服务端开发模式-应用开发-前端个人资料开发
  • 基于51单片机俄罗斯方块游戏—可暂停
  • 一文了解git TAG
  • 通过scrapy和Django登录、爬取和持久化数据
  • 如何使用 SSH 连接并管理你的 WordPress 网站
  • 鸿蒙进阶篇-剩余和展开、简单和复杂类型
  • 丹摩征文活动 | SD3+ComfyUI的图像部署实践