当前位置: 首页 > article >正文

数据的简单处理——pandas模块——数据结构(Series和DataFrame对象)

    pandas模块是基于Numpy模块开发的。在pandas模块中有两个重要的数据结构对象——Series和DataFrame。使用这两个对象可以在计算机的内存中构建虚拟的数据库。对于Series和DataFrame对象主要有三类,都是包括普通默认的方式、添加行列标签的方式、采用字典创建数据结构的方式。DataFarme是一种二维的数据结构对象,用该对象创建的数据结构在形式上类似与Excel表格。相比于Series对象,DateFarme对象在实际的工作中的应用更加广泛。
##############################
##作者:白雪公主的后妈
##时间:2024年12月29日
##主题:数据的简单处理——pandas模块——数据结构
##############################
#1、数据结构
'''
    pandas模块是基于Numpy模块开发的。在pandas模块中有两个重要的数据结构对象——Series和DataFrame。使用这两个对象可以
    在计算机的内存中构建虚拟的数据库。
'''
#1.1    Series对象
#与一维数组不同的是不仅包含数据元素,还包含数组元素的标签。
import pandas as pd
s=pd.Series(["短裤","毛衣","连衣裙","牛仔裤"])
print(s)
'''
运行结果:
0     短裤
1     毛衣
2    连衣裙
3    牛仔裤
dtype: object
'''
####################################
#以上是系统定义的标签,如果想要自定义标签时,可以使用Series对象中参数index传入元素的行标签列表
s1=pd.Series(["短裤","毛衣","连衣裙","牛仔裤"],index=["a001","a002","a003","a004"])
print(s1)
'''
运行结果:
a001     短裤
a002     毛衣
a003    连衣裙
a004    牛仔裤
dtype: object
'''
####################################
#Series对象还可以基于字典创建数据结构
s2=pd.Series({"a001":"短裤","a002":"毛衣","a003":"连衣裙","a004":"牛仔裤"})
print(s2)
'''
运行结果:
a001     短裤
a002     毛衣
a003    连衣裙
a004    牛仔裤
dtype: object
'''
#1.2    DataFarme对象
'''
DataFarme是一种二维的数据结构对象,用该对象创建的数据结构在形式上类似与Excel表格。
相比于Series对象,DateFarme对象在实际的工作中的应用更加广泛。
'''
import pandas as pd
df=pd.DataFrame([["短裤",45],["毛衣",69],["连衣裙",119],["牛仔裤",99]])
print(df)
'''
运行结果:
     0    1
0   短裤   45
1   毛衣   69
2  连衣裙  119
3  牛仔裤   99
'''
import pandas as pd
df1 = pd.DataFrame([["短裤", 45], ["毛衣", 69], ["连衣裙", 119], ["牛仔裤", 99]],columns=["产品","单价"],index=["a001","a002","a003","a004"])
print(df1)
'''
运行结果:使用columns和index定义行标签和列标签
       产品   单价
a001   短裤   45
a002   毛衣   69
a003  连衣裙  119
a004  牛仔裤   99
'''
#######################采用字典的方式
import pandas as pd
df2 = pd.DataFrame({"产品":["短裤", "毛衣","连衣裙","牛仔裤"],"单价":[45,69,119,99]},index=["a001","a002","a003","a004"])
print(df2)


http://www.kler.cn/a/463419.html

相关文章:

  • 信息科技伦理与道德1:研究方法
  • 无线AP安装注意事项
  • 【可实战】需求分析-测试计划↓-测试设计-测试执行-测试总结↓(包含测试计划、测试总结模板,以公司要求为准)
  • linux-26 文件管理(四)install
  • 路径规划 | 基于极光PLO优化算法的三维路径规划Matlab程序
  • SqlSession的线程安全问题源码分析
  • 韩国首尔阿里云200M不限流量轻量云主机测试报告
  • Flink源码解析之:如何根据StreamGraph生成JobGraph
  • IP寻址映射与网络通信互联
  • [react] 纯组件优化子
  • JMeter脚本参数化与并发策略
  • Vue 针对浏览器参数过长实现浏览器参数加密解密
  • 人工智能机器学习基础篇】——深入详解强化学习 基础知识,理解马尔可夫决策过程(MDP)、策略、价值函数等关键概念
  • FPGA实现HDMI输出
  • 2024树莓派apt源(可用)
  • 【Leetcode 热题 100】79. 单词搜索
  • Amazon Bedrock 实践 - 利用 Llama 3.2 模型分析全球糖尿病趋势
  • uni-app开发-识图小程序-分类识别功能
  • [微服务] - MQ高级
  • 游戏引擎学习第69天
  • doris:基于 Arrow Flight SQL 的高速数据传输链路
  • 小红书ip属地是怎么更新的
  • redis如何实现延时队列
  • 基于单片机的无线智能台灯(论文+源码)
  • STM32单片机芯片与内部54 AT24C02读写 硬件IIC 标准库 HAL库
  • 生态碳汇涡度相关监测与通量数据分析