当前位置：首页 > article >正文

【数据分析】读取文档（读取Excel）

article 2025/3/17 6:09:51

与读取CSV文件相似， Excel文件的读取也差不多。

因为Excel文件读取和CSV文件读取之间的区别就是一个词Excel。但它们的参数不完全通用，例如：encoding。

在学习读取Excel文件前，我们需要先安装一个用于读取Excel文件的辅助工具：xlrd 模块。

在终端中输入pip install xlrd==1.2.0安装xlrd模块。

读取Excel文件

在pandas模块中，读取Excel文件主要使用pd.read_excel()函数。

将必选参数 - Excel文件的路径传入该函数中，便可以得到对应的DataFrame格式的数据。

下面是一个简单的示例：将一份2019年的超市销售订单数据的Excel文件路径传入pd.read_excel()函数后，得到了该数据对应的DataFrame格式的数据。
此时，读取出的数据会被自动添加默认从0开始的行索引index和列索引columns，并且columns默认是原来数据的第一行。

面对特殊情况的处理

和读取CSV文件一样，pd.read_excel()函数也为我们提供了大量的可选参数来处理形形色色的情况。

之前学习的参数也可以用在pd.read_excel()函数中。

除此之外，还有1个特殊的场景是只在处理Excel文件时能遇到的。

接下来，我们将通过分析这个场景来帮助大家理解pd.read_excel()函数中另一个最常用的可选参数。

读取指定工作表

当Excel文件里有多个工作表时，默认情况下，pd.read_excel()函数会读取第一个工作表。
but now，我们想要具体分析该超市的销售情况，那么就需要读取Excel文件中的第二个工作表 - "销售订单数据"。

读取指定工作表-sheet_name

当我们需要读取指定工作表时，pd.read_excel()函数提供了一个参数：sheet_name，将要读取的工作表名称作为字符串传入该参数即可。

# 导入pandas模块，并以"pd"为该模块的简写

import pandas as pd

# TODO 使用pd.read_excel()函数和sheet_name参数

# 读取路径为 "/Users/yequ/2019年4月销售订单.xlsx" 的Excel文件里："销售订单数据" 这个工作表

# 并将结果赋值给变量data

data = pd.read_excel( "/Users/yequ/2019年4月销售订单.xlsx",sheet_name="销售订单数据")

# 使用print()输出变量data

print(data)

总结：

读取Excel文件

在pandas模块中，读取Excel文件主要使用pd.read_excel()函数。
当我们需要读取指定工作表时，pd.read_excel()函数提供了一个参数：sheet_name，将要读取的工作表名称作为字符串传入该参数即可

查看全文

http://www.kler.cn/a/587972.html

Varjo：为战场各兵种综合训练提供XR技术支持

DeepSeek-R1大模型微调技术深度解析：架构、方法与应用全解析

【论文阅读】Cross-View Fusion for Multi-View Clustering

Flash Attention原理讲解

【Linux】：socket编程——UDP

传输层tcp/udp

287. 寻找重复数

Python实现万年历

DAY34 贪心算法Ⅲ

C++模版(复习)

C++|类和对象

Android 拍照开发——移动虚拟机摄像头

java简单基础学习

关于离子滤波小记

数据库管理-第302期国产类RAC架构数据库网络连接方式（20250314）

RabbitMQ：业务幂等、死信交换机

C++基础——从C语言快速入门

matlab 自适应模糊PID在反应釜温度控制中的应用

每日定投40刀BTC（9）20250312 - 20250315

Python 鼠标轨迹算法 - 防止游戏检测

相关文章：