当前位置: 首页 > article >正文

Python利器:os与chardet读取多编码文件

在数据处理中会遇到读取位于不同位置的文件,每个文件所在的层级不同,而且每个文件的编码类型各不相同,那么如何高效地读取文件呢?

在读取文件时首先需要获取文件的位置信息,然后根据文件的编码类型来读取文件。本文将使用os获取文件路径,使用chardet得到文件编码类型。

获取文件路径

  1. 相同层级下的文件
import os

data_files = []
files_dir = "./data"

dirs = os.listdir(files_dir)
for dir in dirs:
  file_path= os.path.join(files_dir,dir)
  data_files.append(file_path)

print(data_files)

  1. 不同层级下的文件
txt_files = []
init_dir = "../data"

for root, dirs, files in os.walk(init_dir):
    for file in files:
        if file.endswith(".txt"):
            file_path = os.path.join(root

http://www.kler.cn/a/135453.html

相关文章:

  • 【HarmonyOS NEXT】一次开发多端部署(以轮播图、Tab栏、列表为例,配合栅格布局与媒体查询,进行 UI 的一多开发)
  • 【C++】类与对象的基础概念
  • C#程序开发,检测当前电脑已经安装的软件目录
  • vue项目npm run serve出现【- Network: unavailable】(从排查到放弃)
  • Java基础-组件及事件处理(下)
  • SpringBoot(七)使用mapper注解编写sql操作数据库
  • 德语B级SampleAcademy
  • Golang环境搭建Win10(简洁版)
  • Redux-状态管理组件
  • 053-第三代软件开发-元对象系统
  • Java中异常的概念、体系结构和分类
  • docker安装elasticsearch,elasticsearch-head
  • 【数字图像处理】Gamma 变换
  • 【Electron】electron-builder打包失败问题记录
  • svn问题集
  • 解决requests 2.28.x版本SSL错误:证书验证失败
  • 【Linux】Linux下的基础IO
  • Redis字典实现
  • Pikachu漏洞练习平台之XXE(XML外部实体注入)
  • C语言——写一个函数,每调用一次这个函数,就会将num的值增加1
  • Java拼图小游戏
  • 数电实验-----实现74LS153芯片扩展为8选1数据选择器以及应用(Quartus II )
  • vue3+ts扩展全局属性
  • Python编程陷阱(九)
  • Java 算法篇-链表的经典算法:判断回文链表、判断环链表与寻找环入口节点(“龟兔赛跑“算法实现)
  • 【信息安全】浅谈SQL注入攻击的概念、原理和防范措施:简单分析六种常见攻击方式