当前位置: 首页 > article >正文

pandas笔记

read_csv读取之后,会返回DataFrame格式的文件

读取去掉头的文件

import pandas as pd  
  
df = pd.read_csv('file.csv', header=None)

按列名读取某一列

pd['列名']

按索引读取n列

如读取前13列所有行的值

pd.iloc[:,:13]

忽略掉第一行,读取剩下所有行

原表格的第一行是统计的行数和列数,剩下的是空值,读取之后变成了 unnamed:
在这里插入图片描述使用如下代码去掉原文件的第一行

# 读取出来是dataframe格式的,忽略掉第一行,读取剩下所有行
boston = pd.read_csv('../data/boston_house_prices.csv',skiprows=[0])
print(type(boston))
boston

在这里插入图片描述

删除某列,并返回该列(带列头)

# 从dataframe格式的boston中,删除列为MEDV的列,并返回该列(带列头)
y = boston.pop('MEDV')

统计每一列的NaN和None这种空值

print(boston.isnull().sum())

热力图计算特征和特征之间的相关性

# 13个特征之间的相关性
import seaborn as sns
plt.figure(figsize=(12, 8))
# 第14列是标签,取前13列进行计算
sns.heatmap(boston.iloc[:,:13].corr(), annot=True, fmt='.2f', cmap='PuBu')
plt.show()

http://www.kler.cn/a/108707.html

相关文章:

  • K8资源之endpoint资源EP资源
  • 94个属于一区且接受医工交叉领域投稿的期刊汇总|个人观点·24-11-13
  • Ubuntu安装MySQL8
  • libcurl.net入门使用
  • 探索 HTTP 请求方法:GET、POST、PUT、DELETE 等的用法详解
  • ESLint 使用教程(三):12个ESLint 配置项功能与使用方式详解
  • spring-aop-execution表达式
  • vue3.0运行npm run dev 报错Cannot find module node:url
  • 文心一言 VS 讯飞星火 VS chatgpt (123)-- 算法导论10.4 4题
  • Java SE 学习笔记(十七)—— 单元测试、反射
  • POJ 1201 Intervals 线段树
  • 微信小程序之投票管理
  • Leetcode—274.H指数【中等】
  • Java 四种引用类型
  • 【网络协议】聊聊TCP如何做到可靠传输的
  • redis 常用方法
  • 71 搜索二维矩阵
  • 大数据之LibrA数据库常见术语(十)
  • Springmvc 讲解(1)
  • 嵌入式开发
  • Animate(原Flash)和木疙瘩中遮罩动画秒懂
  • 黑客在Pwn2Own Toronto上以58个零日漏洞赚取超过100万美元
  • dump与strace命令实战之分析keystore死锁导致watchdog问题
  • 正向代理和反向代理
  • 基于springboot实现校园疫情防控系统项目【项目源码+论文说明】计算机毕业设计
  • 【多线程面试题 八】、说一说Java同步机制中的wait和notify