Python之Excel操作 - 读取数据
我们将使用 openpyxl 库,它是一个功能强大且易于使用的库,专门用于处理 Excel 文件。
1. 安装 openpyxl
首先,你需要安装 openpyxl 库。你可以使用 pip 命令进行安装:
pip install openpyxl
2. 读取 Excel 文件
要读取 Excel 文件,可以使用 openpyxl.load_workbook() 函数。该函数会返回一个 Workbook 对象,代表整个 Excel 文件。
import openpyxl
excel = openpyxl.load_workbook("example.xlsx")
print(type(excel))
sheet1 = excel['Sheet1']
print(type(sheet1))
print(sheet1['B1'].value)
for row in sheet1.iter_rows(min_row=2, values_only= True):
print(row)
print(type(row))
for row in range(2, sheet1.max_row+1):
name = sheet1['A'+str(row)].value
value = sheet1['B'+str(row)].value
print(name)
print(value)
取出各个单元格中的值 就可以进行其他操作了。
使用如下方法可以查看是否是空行:
for row in sheet.iter_rows(values_only=True):
if any(cell is not None for cell in row): # 过滤空行
print(row)
解释:
- 上面row 的类型是<class ‘tuple’>,
- 使用 is not 是因为 None 是一个单例对象,is 比较的是对象的身份(内存地址),而 == 比较的是值。
- any:any() 是 Python 的内置函数,接受一个可迭代对象(如生成器表达式)作为参数。
如果可迭代对象中至少有一个元素为 True,则 any() 返回 True;否则返回 False
cell is not None for cell in row 会生成一个布尔值序列:(False, False, True, False)。
any(False, False, True, False) 返回 True,因为至少有一个 True。