Python在实际工作中的运用-Excel数据统计和数据分析
说起Excel数据统计和数据分析,这也是Excel的强项,那为什么还要用python呢!我认为主要原因还是和使用场景有关,在需要进行重复性的、自动化的出具数据统计和分析报表方面,采用python来完成还是比较适合的。下面我们就用python的 pandas 和 openpyxl 库来详细说说吧:
首先安装pandas 和 openpyxl 库
pip install openpyxl pandas
如果PyPI源安装太慢,可以采用清华源地址:
pip install openpyxl pandas -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
在开始前我们需要首先认识下DataFrame,它是Pandas库中的一个核心数据结构,是一个二维标签化的数据结构,可以认为它是一个Excel表格或者SQL表,具有行标签和列标签。以下内容摘抄自Python的DataFrame从0开始详解 和 Pandas中DataFrame基本函数整理
DataFrame构造函数:
DataFrame([data, index, columns, dtype, copy]) #构造数据框
案例1:分组统计 DataFrame.groupby([by, axis, level, …])
import os.path
import pandas as pd
from pandas import DataFrame
# 读取xls文件内容
xlsfile = f"E:/案例/带分析的表格.xlsx"
data = pd.read_excel(xlsfile)
# 按员工名称分组统计
alldata=data.groupby('员工姓名')['员工姓名'].count()
# 保存分组统计结果
alldata.to_excel(f'{os.path.dirname(xlsfile)}/output.xlsx')