当前位置: 首页 > article >正文

【Kaggle | Pandas】练习5:数据类型和缺失值

文章目录

    • 1. 获取列数据类型.dtype / .dypes
    • 2. 转换数据类型.astype()
    • 3. 获取数据为空的列 .isnull()
    • 4. 将缺少值替换并且排序.fillna(),.sort_values()

1. 获取列数据类型.dtype / .dypes

数据集中points列的数据类型是什么?

# Your code here
dtype = reviews.points.dtype

2. 转换数据类型.astype()

从points列中的条目创建一个系列,但将条目转换为字符串。提示:字符串在本机 Python 中是str

point_strings = reviews.points.astype(str)

3. 获取数据为空的列 .isnull()

有时价格列为空。数据集中有多少评论缺少价格?

missing_price_reviews = reviews[reviews.price.isnull()]
n_missing_prices = len(missing_price_reviews)
# Cute alternative solution: if we sum a boolean series, True is treated as 1 and False as 0
n_missing_prices = reviews.price.isnull().sum()
# or equivalently:
n_missing_prices = pd.isnull(reviews.price).sum()

4. 将缺少值替换并且排序.fillna(),.sort_values()

最常见的葡萄酒产区有哪些?创建一个系列,计算每个值在region_1字段中出现的次数。该字段经常缺少数据,因此将缺少的值替换为Unknown 。按降序排列。你的输出应该是这样的:
在这里插入图片描述


reviews_per_region = reviews.region_1.fillna('Unknown').value_counts().sort_values(ascending = False)

http://www.kler.cn/a/375242.html

相关文章:

  • 分享某大佬微信hook 最新版本 dll (懂得都懂)
  • MyBatis 中常用标签
  • 递归查询全量分页数据问题
  • 数据流图和流程图的区别
  • 【Jenkins】持久化
  • TCP与UDP的端口连通性
  • 【Redis优化——如何优雅的设计key,优化BigKey,Pipeline批处理Key】
  • 力扣每日一题 超级饮料的最大强化能量 动态规划(dp)
  • python后端框架登录入门
  • Java期末考试
  • Git介绍及用法
  • 微服务day01
  • 10.31OpenCV_图像预处理习题
  • 推荐一款功能强大的思维导图制作工具:MindMaster
  • React.js教程:从JSX到Redux的全面解析
  • C/C++每日一练:实现选择排序
  • 大语言模型及LangChain介绍
  • 【oracle】正则表达式
  • 蓝禾,汤臣倍健,三七互娱,得物,顺丰,快手,途游游戏,埃科光电25秋招内推
  • Bolt.new: 终极自动化全栈编程工具,吊打 cursor
  • 【ZZULI】数据库第二次实验
  • C# 结构型设计模式----外观模式
  • 图像的特征类别
  • 2024前端面试训练计划-高频题-JavaScript基础篇
  • ubuntu禁止自动更新设置
  • 新浪新闻探索大会|赵世奇:文心智能体解锁AI浪潮中的商业新范式