当前位置: 首页 > article >正文

pandas笔记

read_csv读取之后,会返回DataFrame格式的文件

读取去掉头的文件

import pandas as pd  
  
df = pd.read_csv('file.csv', header=None)

按列名读取某一列

pd['列名']

按索引读取n列

如读取前13列所有行的值

pd.iloc[:,:13]

忽略掉第一行,读取剩下所有行

原表格的第一行是统计的行数和列数,剩下的是空值,读取之后变成了 unnamed:
在这里插入图片描述使用如下代码去掉原文件的第一行

# 读取出来是dataframe格式的,忽略掉第一行,读取剩下所有行
boston = pd.read_csv('../data/boston_house_prices.csv',skiprows=[0])
print(type(boston))
boston

在这里插入图片描述

删除某列,并返回该列(带列头)

# 从dataframe格式的boston中,删除列为MEDV的列,并返回该列(带列头)
y = boston.pop('MEDV')

统计每一列的NaN和None这种空值

print(boston.isnull().sum())

热力图计算特征和特征之间的相关性

# 13个特征之间的相关性
import seaborn as sns
plt.figure(figsize=(12, 8))
# 第14列是标签,取前13列进行计算
sns.heatmap(boston.iloc[:,:13].corr(), annot=True, fmt='.2f', cmap='PuBu')
plt.show()

http://www.kler.cn/news/108707.html

相关文章:

  • spring-aop-execution表达式
  • vue3.0运行npm run dev 报错Cannot find module node:url
  • 文心一言 VS 讯飞星火 VS chatgpt (123)-- 算法导论10.4 4题
  • Java SE 学习笔记(十七)—— 单元测试、反射
  • POJ 1201 Intervals 线段树
  • 微信小程序之投票管理
  • Leetcode—274.H指数【中等】
  • Java 四种引用类型
  • 【网络协议】聊聊TCP如何做到可靠传输的
  • redis 常用方法
  • 71 搜索二维矩阵
  • 大数据之LibrA数据库常见术语(十)
  • Springmvc 讲解(1)
  • 嵌入式开发
  • Animate(原Flash)和木疙瘩中遮罩动画秒懂
  • 黑客在Pwn2Own Toronto上以58个零日漏洞赚取超过100万美元
  • dump与strace命令实战之分析keystore死锁导致watchdog问题
  • 正向代理和反向代理
  • 基于springboot实现校园疫情防控系统项目【项目源码+论文说明】计算机毕业设计
  • 【多线程面试题 八】、说一说Java同步机制中的wait和notify
  • 如何借助数据集更好的评估NLP模型的性能?
  • 【数据结构】数组和字符串(九):稀疏矩阵的链接存储:十字链表的插入、查找、删除操作
  • 大数据可视化BI分析工具Apache Superset实现公网远程访问
  • 【数据结构】Map和Set
  • 深入浅出排序算法之基数排序
  • OS的Alarm定时器调度机制
  • oracle,CLOB转XML内存不足,ORA-27163: out of memory ORA-06512: at “SYS.XMLTYPE“,
  • Think-Queue3一直提示[Exception]redis扩展未安装
  • 开源B2B网站电子商务平台源码下载搭建 实现高效交易的桥梁
  • Kotlin数据流概览