pandas-数据分析-练习题-第1次练习
文章目录
- 简介
- 开始练习
- 第一题
- 第二题
- 第三题
- 第四题
- 第五题
- 第六题
- 第七题
- 第八题
- 第九题
- 第十题
- 第十一题
简介
每次更新大概10个左右的关于pandas的操作知识点!做练习要从第一步开始,防止报错!
本环境是Anaconda创建的虚拟环境中打开的jupyter notebook进行练习的!
本次练习是学习博主的视频,大家有需要可以自己去学习!
Pandas教程:Python数据分析80道练习题,每日一练,学完必成大神!(某站搜索)
开始练习
第一题
# 创建一个包含名字和年龄的DataFrame
data = {"姓名": ["Tom", "John", "Amy", "Tom"], "年龄": [18, 22, 38, 22]}
df = pd.DataFrame(data)
运行结果:
姓名 年龄
0 Tom 18
1 John 22
2 Amy 38
3 Tom 22
第二题
# 显示创建的前两行数据
df.head(2)
运行结果:
姓名 年龄
0 Tom 18
1 John 22
第三题
# 显示创建的后两行数据
df.tail(2)
运行结果:
姓名 年龄
2 Amy 38
3 Tom 22
第四题
# 提取出名字相同的"Tom"的行
df[df["姓名"] == "Tom"]
运行结果:
姓名 年龄
0 Tom 18
3 Tom 22
第五题
# 输出所有的列表头名
df.columns
运行结果:
Index(['姓名', '年龄'], dtype='object')
第六题
# 修改第二列的名字叫"age"
df.rename(columns={"年龄": "age"})
运行结果:
姓名 age
0 Tom 18
1 John 22
2 Amy 38
3 Tom 22
第七题
# 按照姓名去重
df.drop_duplicates(subset="姓名")
运行结果:
姓名 年龄
0 Tom 18
1 John 22
2 Amy 38
第八题
# 统计年龄的平均值
df['年龄'].mean()
运行结果:
25.0
第九题
# 查找年龄大于23的行
df[df['年龄'] > 23]
运行结果:
姓名 年龄
2 Amy 38
第十题
# 按照年龄降序排序
df.sort_values('年龄', ascending=False)
运行结果:
姓名 年龄
2 Amy 38
1 John 22
3 Tom 22
0 Tom 18
第十一题
# 计算年龄的总和
df['年龄'].sum()
运行结果:
100