当前位置: 首页 > article >正文

Python利器:os与chardet读取多编码文件

在数据处理中会遇到读取位于不同位置的文件,每个文件所在的层级不同,而且每个文件的编码类型各不相同,那么如何高效地读取文件呢?

在读取文件时首先需要获取文件的位置信息,然后根据文件的编码类型来读取文件。本文将使用os获取文件路径,使用chardet得到文件编码类型。

获取文件路径

  1. 相同层级下的文件
import os

data_files = []
files_dir = "./data"

dirs = os.listdir(files_dir)
for dir in dirs:
  file_path= os.path.join(files_dir,dir)
  data_files.append(file_path)

print(data_files)

  1. 不同层级下的文件
txt_files = []
init_dir = "../data"

for root, dirs, files in os.walk(init_dir):
    for file in files:
        if file.endswith(".txt"):
            file_path = os.path.join(root

http://www.kler.cn/a/135453.html

相关文章:

  • 计算机网络例题
  • Ubuntu 20.04安装gcc
  • 【C++习题】20. 两个数组的交集
  • 2、蓝牙打印机点灯-GPIO输出控制
  • Agent | Dify中的两种可选模式
  • 《繁星路》V1.8.3(Build16632266)官方中文学习版
  • 德语B级SampleAcademy
  • Golang环境搭建Win10(简洁版)
  • Redux-状态管理组件
  • 053-第三代软件开发-元对象系统
  • Java中异常的概念、体系结构和分类
  • docker安装elasticsearch,elasticsearch-head
  • 【数字图像处理】Gamma 变换
  • 【Electron】electron-builder打包失败问题记录
  • svn问题集
  • 解决requests 2.28.x版本SSL错误:证书验证失败
  • 【Linux】Linux下的基础IO
  • Redis字典实现
  • Pikachu漏洞练习平台之XXE(XML外部实体注入)
  • C语言——写一个函数,每调用一次这个函数,就会将num的值增加1
  • Java拼图小游戏
  • 数电实验-----实现74LS153芯片扩展为8选1数据选择器以及应用(Quartus II )
  • vue3+ts扩展全局属性
  • Python编程陷阱(九)
  • Java 算法篇-链表的经典算法:判断回文链表、判断环链表与寻找环入口节点(“龟兔赛跑“算法实现)
  • 【信息安全】浅谈SQL注入攻击的概念、原理和防范措施:简单分析六种常见攻击方式