当前位置: 首页 > article >正文

pandas基本应用记录

查询行数和列数

data.describe()

查询前3行数据

data.head(3)

打印第几行第几列

data.loc[index,  cloumn_name ]

分组统计 不带行索引

data.groupby( column_1 )[ column_2 ].apply(sum)

去除含有NAN数据行/列

df = df.dropna()  # default: axis=0, how='any' 意思是只要有nan,就删除一行,how='any|all';若how='all',则代表当一行全为nan,才会删除。若把axis=0改为1,则代表删除列。

删除数据中重复值

drop_duplicates函数 :

数据合并:

提供了concat,merge,join和append四种方法用于dataframe的拼接

过滤属性:

filter(items=['列名1','列名2']) 

用正则过滤

data.filter(regex="", axis=1)

iterrows函数用于对DataFrame进行迭代循环

 删除列

pd.pop('列名')

根据字段类型来筛选数据,可以包含或者排除一个或者多个字段类型的数据。

查询包含多列类型的数据

pd.select_dtypes(include=['列名','列名'])

查询不包含多列类型的数据

pd.select_dtypes(exclude=['列名','列名'])

select_dtypes()

查看每列的数据类型

pd.dtypes

 进行比较的一个函数:ge表示greater equal

数据求和

expanding 这是一个窗口函数,实现的是一种类似累计求和的功能

pd.expanding(1).sum()


http://www.kler.cn/a/4973.html

相关文章:

  • Kivy App开发之UX控件Slider滑块
  • awr报告无法生成:常见分析手段
  • 完美解决VMware 17.0 Pro安装ubuntu、Deepin等虚拟机后卡顿、卡死问题
  • PostgreSQL 18新特性之uuidv7函数
  • socket网络编程-TC/IP方式
  • Windows 11 上配置VSCode 使用 Git 和 SSH 完整步骤
  • springboot集成xx-job;
  • Ubuntu系统安装基本Nginx和docker和一些其他的软件的基本操作
  • node-fs
  • Downie 4 4.6.12 MAC上最好的一款视频下载工具
  • Machine Learning-Ex2(吴恩达课后习题)About Logistic Regression
  • 【MongoDB】P1 MongoDB简介与下载
  • 念一句咒语 AI 就帮我写一个应用,我人麻了...
  • 项目管理协会(PMI)人才三角
  • 篇章八 Git 详细使用说明
  • 【java基础】一篇文章彻底搞懂Optional
  • 【免费教程】 长时间序列遥感数据讲解与经验分享
  • GET请求和POST请求区别
  • 【RocketMQ】RocketMQ 5.1.0版本Proxy集群模式部署实践
  • 【共创共赢】AntDB数据库合作伙伴交流会(北京站)顺利举办
  • NVT | NT96660 NVTIPC库应用说明
  • GO实现Redis:GO实现Redis的AOF持久化(4)
  • Ubuntu22.04部署Kubernetes集群(亲测可用)
  • GROUP_CONCAT的进阶使用
  • TryHackMe-Madeye‘s Castle(boot2root)
  • 基于springboot和vue实现地方美食分享网站演示【附项目源码】分享