当前位置: 首页 > article >正文

【Pandas】pandas Series to_pickle

Pandas2.2 Series

Serialization & IO & conversion

方法描述
Series.to_pickle(path, *[, compression, …])用于将 Series 对象序列化为二进制格式并保存到文件中

pandas.Series.to_pickle

pandas.Series.to_pickle 方法用于将 Series 对象序列化为二进制格式并保存到文件中。这种格式可以高效地存储和读取数据,特别适用于需要快速加载和保存大型数据集的场景。

参数说明
  • path:字符串或类似文件的对象,指定保存文件的路径或文件对象。
  • compression:可选,字符串,指定压缩方法。可选值包括 'infer''gzip''bz2''zip''xz'None。默认为 'infer',根据文件扩展名自动推断压缩方法。
  • protocol:可选,整数,指定 pickle 协议版本。默认为 5
  • storage_options:可选,字典,指定存储选项,用于远程文件系统(如 S3)。
示例
import pandas as pd

# 创建一个示例 Series
data = pd.Series([10, 20, 30, 40, 50], index=['A', 'B', 'C', 'D', 'E'])

# 将 Series 保存为 pickle 文件
data.to_pickle('data.pkl')

# 使用 gzip 压缩保存
data.to_pickle('data_compressed.pkl', compression='gzip')

# 读取 pickle 文件
loaded_data = pd.read_pickle('data.pkl')
print("Loaded Data:\n", loaded_data)

# 读取压缩的 pickle 文件
loaded_compressed_data = pd.read_pickle('data_compressed.pkl', compression='gzip')
print("Loaded Compressed Data:\n", loaded_compressed_data)
结果
Loaded Data:
 A    10
B    20 
C    30 
D    40
E    50
dtype: int64
Loaded Compressed Data:
 A    10
B    20
C    30
D    40
E    50
dtype: int64
  1. 保存为 pickle 文件

    • 文件路径:data.pkl
    • 数据内容:Series([10, 20, 30, 40, 50], index=['A', 'B', 'C', 'D', 'E'])
    • 压缩方法:无
  2. 使用 gzip 压缩保存

    • 文件路径:data_compressed.pkl
    • 数据内容:Series([10, 20, 30, 40, 50], index=['A', 'B', 'C', 'D', 'E'])
    • 压缩方法:gzip
  3. 读取 pickle 文件

    • 文件路径:data.pkl
    • 加载的数据:Series([10, 20, 30, 40, 50], index=['A', 'B', 'C', 'D', 'E'])
  4. 读取压缩的 pickle 文件

    • 文件路径:data_compressed.pkl
    • 加载的数据:Series([10, 20, 30, 40, 50], index=['A', 'B', 'C', 'D', 'E'])

通过这些示例,可以看到 pandas.Series.to_pickle 方法如何将 Series 对象保存为二进制文件,并支持不同的压缩方法以节省存储空间。读取时可以使用 pd.read_pickle 方法恢复数据。


http://www.kler.cn/a/601084.html

相关文章:

  • Axure设计之中继器表格——拖动行排序教程(中继器)
  • 1.基于TCP的简单套接字服务器实现
  • 【SOC 芯片设计 DFT 学习专栏 -- IDDQ 测试 与 Burn-In 测试】
  • 【数据结构初阶八大排序】---冒泡、选择、插入、希尔、堆排、快排、归并、计数
  • 数据库索引相关的面试题以及答案
  • 医院挂号预约小程序|基于微信小程序的医院挂号预约系统设计与实现(源码+数据库+文档)
  • 双指针技巧在C++中的应用:从基础到进阶
  • 在 Ubuntu 中配置开机自启动脚本并激活 Anaconda 环境
  • Vue学习笔记集--create-vue
  • 宝塔ssl 证书申请流程
  • PDR的matlab实现
  • Android音视频多媒体开源库基础大全
  • C++进阶——哈希表的实现
  • STM32蜂鸣器播放音乐
  • 【Linux-驱动开发-GPIO子系统】
  • ECharts实现数据可视化
  • xiaozhi-esp32-server在linux下源码安装
  • msyql--基本操作之运维篇
  • SOLIDEDGE 至 STL 转换:数字化设计制造的关键衔接
  • 使用UDP消息与iptables实现TCP端口敲门安全技术