当前位置: 首页 > article >正文

中英翻译数据集处理

添加数据集

https://aistudio.baidu.com/datasetdetail/209041

解压数据集

!unzip /home/aistudio/data/data209041/translation2019zh.zip

处理成voc

import pandas as pd
import numpy as np
from tqdm import tqdm


def gen_sp(en_voc1)</

http://www.kler.cn/news/157149.html

相关文章:

  • JFrog----常见的开源协议以及应用注意点
  • ESP32-Web-Server编程- 通过文本框向 Web 提交数据
  • 微信小程序跳转到外部小程序
  • 初步认识结构体
  • JVM之垃圾回收与算法(四)
  • 即兴语录-即兴小索奇语录
  • 数据结构:字典树(前缀树,Trie树),压缩字典树(Radix)
  • [ROS2] --- ROS diff ROS2
  • 11. 哈希冲突
  • python pyaudio给数据加噪声
  • PTA 7-229 sdut-C语言实验- 排序
  • 【数电笔记】06-码制
  • golang构建docker镜像的几种方式
  • 7. 系统信息与系统资源
  • ComfiUI API调用随记
  • vue3 中使用 sse 最佳实践,封装工具
  • 堆排序详细解读
  • 记录 | pip加速配置
  • Java中的锁
  • 一文打尽相机单目标定(远心,沙姆镜头)
  • 2024搞钱方式,这些你都了解吗?
  • Java NIO SelectionKey
  • 使用求2个字符串最长公共子序列的方法来实现 git diff 算法 java 实现
  • Kotlin学习之集合
  • 使用JAVA语言写一个排队叫号的小程序
  • C++ 系列 第四篇 C++ 数据类型上篇—基本类型
  • 数据结构学习笔记——广义表
  • 实体、协议、服务和服务访问点
  • 【重点】【滑动窗口】239. 滑动窗口最大值
  • Appium:iOS部署