当前位置: 首页 > article >正文

【第二月_day7】Pandas 简介与数据结构_Pandas_ day1

以下是专为小白设计的 Pandas 简介与数据结构 学习内容,用最通俗的语言和案例讲解核心概念:


一、安装 Pandas

1. 安装方法
  • 打开电脑的命令提示符(Windows)或终端(Mac/Linux)
  • 输入以下命令并回车:
    pip install pandas
    
  • 安装完成后,输入 python 进入 Python 环境,输入 import pandas as pd 验证是否成功(不报错即可)

二、Pandas 的核心数据结构

1. Series(一维数据)
  • 定义:像一个带标签的列表,比如一列Excel数据

  • 创建方法

    import pandas as pd
    
    # 用列表创建
    s1 = pd.Series([10, 20, 30, 40])
    
    # 自定义索引(类似给数据加名字)
    s2 = pd.Series([5, 3, 8], index=['苹果', '香蕉', '橘子'])
    
  • 基础操作

    # 查看数据
    print(s2.values)  # 输出数据:[5, 3, 8]
    print(s2.index)   # 输出索引:['苹果', '香蕉', '橘子']
    
    # 按索引取值
    print(s2['香蕉'])  # 输出 3
    
    # 简单计算
    print(s2 + 2)     # 所有数据加2 → 苹果7, 香蕉5, 橘子10
    
2. DataFrame(二维表格)
  • 定义:像 Excel 表格,由多列 Series 组成

  • 创建方法

    # 用字典创建(最常用)
    data = {
      '姓名': ['张三', '李四', '王五'],
      '年龄': [20, 25, 22],
      '城市': ['北京', '上海', '广州']
    }
    df = pd.DataFrame(data)
    
  • 显示表格

    print(df)
    # 输出:
    #    姓名  年龄  城市
    # 0 张三  20  北京
    # 1 李四  25  上海
    # 2 王五  22  广州
    
  • 核心概念

    • 列名:表格的标题(如‘姓名’、‘年龄’)
    • 索引:最左边的数字(0,1,2),类似行号

三、Series vs DataFrame

特性SeriesDataFrame
维度一维(单列)二维(多列)
数据形式单列数据+索引多列数据+列名+索引
常用场景存储单列数据(如温度)存储完整表格(如成绩单)

四、DataFrame 的常用操作

1. 查看数据
df.head(2)    # 查看前2行
df.tail(1)    # 查看最后1行
df.shape      # 显示表格形状(行数, 列数)
2. 选择数据
# 选择列
df['姓名']     # 获取“姓名”列(返回Series)
df[['姓名', '年龄']]  # 选择多列(返回DataFrame)

# 选择行
df.iloc[0]    # 通过数字索引选第1行
df.loc[0]     # 同上(简单场景)
3. 添加/删除列
# 添加新列
df['性别'] = ['男', '女', '男']

# 删除列
df.drop('城市', axis=1, inplace=True)  # axis=1表示列
4. 读取文件(实战)
# 读取CSV文件(比如从Excel导出的数据)
df = pd.read_csv('data.csv')

五、小练习

  1. 创建一个 Series,记录一周温度:周一18℃,周二20℃,周三22℃
  2. 创建一个 DataFrame,包含三列:商品名称(苹果、香蕉)、价格(5、3)、库存(10、8)
  3. 尝试从 DataFrame 中筛选出价格大于4元的商品

通过这个教程,你已经能用 Pandas 处理简单的表格数据啦!下一步可以学习数据清洗和统计计算 🚀


http://www.kler.cn/a/600387.html

相关文章:

  • 数据结构——链式队列
  • Spring Security核心源码和功能实现
  • M芯片mac安装Linux虚拟机
  • HTML和CSS基础
  • 数据结构初阶-二叉树的应用
  • 1688关键字API接口解析:(实战案例)
  • Day110 若依-基础
  • mysql数据实时全量+增量迁移
  • 【论文笔记】生成对抗网络 GAN
  • 统一开放世界与开放词汇检测:YOLO-UniOW无需增量学习的高效通用开放世界目标检测框架
  • 开源视觉语言模型MiniMax-VL-01:动态分辨率+4M超长文本,性能比肩GPT-4o
  • 基础算法01——二分查找(Binary Search)
  • 蓝桥云客 数字接龙
  • Flink 流处理框架的核心特性
  • Linux第零节:Linux命令速查图表(按功能分类)
  • 使用BootStrap 3的原创的模态框组件,没法弹出!估计是原创的bug
  • C# 线程介绍
  • 调用百度api实现语音识别(python)
  • python如何获取html中附件链接,并下载保存附件
  • 珍珠港海军造船厂的“水魔法”:PcVue赋能造船心脏