python初体验: 处理excel数据
一. data.xlsx
二.python代码
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('./data.xlsx', sheet_name='Sheet1', usecols=['Name', 'Age', 'City'])
# 查看数据
print(df.head())
# 筛选数据
df_filtered = df[df['Age'] > 30]
# 添加新列
df_filtered['Salary'] = df_filtered['Age'] * 1000
# 保存结果到新的 Excel 文件
df_filtered.to_excel('./filtered_data.xlsx', index=False)
三. 输出excel
四. 总结
这段代码的功能是读取一个 Excel 文件,对数据进行筛选和处理,然后将结果保存到一个新的 Excel 文件中。具体步骤如下:
读取 Excel 文件:
使用 pandas 库的 read_excel 函数读取名为 data.xlsx 的 Excel 文件。
只读取 Sheet1 工作表中的 Name、Age 和 City 三列数据。
查看数据:
使用 print(df.head()) 查看数据的前几行,默认显示前5行。
筛选数据:
筛选出 Age 列中大于 30 的行,并将结果存储在 df_filtered 中。
添加新列:
在 df_filtered 中添加一个新列 Salary,其值为 Age 列的值乘以 1000。
保存结果到新的 Excel 文件:
将处理后的数据保存到一个新的 Excel 文件 filtered_data.xlsx 中,且不包含行索引(index=False)。
代码总结:
输入:data.xlsx 文件中的 Sheet1 工作表,包含 Name、Age 和 City 列。
输出:filtered_data.xlsx 文件,包含 Age 大于 30 的行,并新增了 Salary 列。
功能:数据读取、筛选、处理和保存。