当前位置: 首页 > article >正文

Python在实际工作中的运用-Excel数据统计和数据分析

        说起Excel数据统计和数据分析,这也是Excel的强项,那为什么还要用python呢!我认为主要原因还是和使用场景有关,在需要进行重复性的、自动化的出具数据统计和分析报表方面,采用python来完成还是比较适合的。下面我们就用python的 pandas 和 openpyxl 库来详细说说吧:

首先安装pandas 和 openpyxl 库

pip install openpyxl pandas 

如果PyPI源安装太慢,可以采用清华源地址:

pip install openpyxl pandas -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

        在开始前我们需要首先认识下DataFrame,它是Pandas库中的一个核心数据结构,是一个二维标签化的数据结构,可以认为它是一个Excel表格或者SQL表,具有行标签和列标签。以下内容摘抄自Python的DataFrame从0开始详解 和 Pandas中DataFrame基本函数整理

DataFrame构造函数:

DataFrame([data, index, columns, dtype, copy]) #构造数据框

案例1:分组统计   DataFrame.groupby([by, axis, level, …])  

import os.path
import pandas as pd
from pandas import DataFrame

# 读取xls文件内容
xlsfile = f"E:/案例/带分析的表格.xlsx"
data = pd.read_excel(xlsfile)

# 按员工名称分组统计
alldata=data.groupby('员工姓名')['员工姓名'].count()

# 保存分组统计结果
alldata.to_excel(f'{os.path.dirname(xlsfile)}/output.xlsx')


http://www.kler.cn/a/558127.html

相关文章:

  • 网页制作06-html,css,javascript初认识のhtml如何建立超链接
  • 怎样从零基础开始学习大模型
  • oppo,汤臣倍健,康冠科技,高途教育25届春招内推
  • go基本语法
  • MySQL 成本优化器 (CBO) 深度解析
  • hi3516cv610的isp调试专业名词
  • 如何使用3D高斯分布进行环境建模
  • MySQL后端返回给前端的时间变了(时区问题)
  • 机器学习(李宏毅)——RL(强化学习)
  • Moving Assets/KrishnaPalacio to Assets/Resources: 拒绝访问。
  • Selenium+OpenCV处理滑块验证问题
  • 大数据组件(四)快速入门实时数据湖存储系统Apache Paimon(2)
  • MySQL日志undo log、redo log和binlog详解
  • 【用deepseek和chatgpt做算法竞赛】——还得DeepSeek来 -Minimum Cost Trees_5
  • Linux 驱动入门(5)—— DHT11(温湿度传感器)驱动
  • 【p-camera-h5】 一款开箱即用的H5相机插件,支持拍照、录像、动态水印与样式高度定制化。
  • 微服务环境搭建架构介绍(附超清图解源代码)
  • Ubuntu 下 nginx-1.24.0 源码分析 - ngx_os_specific_init函数
  • Unity游戏制作中的C#基础(1)界面操作基础
  • leetcode 2506. 统计相似字符串对的数目 简单