当前位置: 首页 > article >正文

数据分析-27-基于pandas进行模糊匹配merge_asof和groupby分组统计

文章目录

  • 1 pd.merge_asof
    • 1.1 简单示例
      • 1.1.1 direction='backward'
      • 1.1.2 direction='forward'
      • 1.1.3 direction='nearest'
    • 1.2 时间序列示例
    • 1.3 DataFrame需要按key排序
  • 2 df.groupby
    • 2.1 SAC原理(Split、Apply、Combine)
    • 2.2 常用的简单聚合函数
      • 2.2.1 单一函数
      • 2.2.2 指定聚合列
    • 2.3 agg(aggerate)
      • 2.3.1 多个聚合函数
      • 2.3.2 各列指定不同的聚合函数
    • 2.4 filter过滤数据
    • 2.5 transform不改变尺寸
    • 2.6 apply应用任意函数
  • 3 参考附录

1 pd.merge_asof

pandas.merge_asof()函数是pandas库中的一个非常实用的函数,用于根据时间戳将两个数据集进行合并。该函数可以很好地处理时间戳不完全匹配的情况,并进行模糊匹配。

此方法用于执行asof合并。
这类似于left-join,除了我们匹配最近的键而不是相等的键。
两个DataFrame都必须按键排序。

在pandas 的 merge asof 中可以做到真正的临近匹配,也就是记录可以往上或往下,选择最近的方向进行匹配。

按键距离执行合并。

pd.merge_asof(
left: 'DataFrame | Series', # 要合并的两个数据集
right: 'DataFrame | Series', # 要合并的两个数据集
on: 'IndexLabel | None' 

http://www.kler.cn/news/329968.html

相关文章:

  • javaScript中的浅拷贝和深拷贝详解
  • synchronized底层是怎么通过monitor进行加锁的?
  • 【Bug】解决 Ubuntu 中 “error: Unable to Find Python3 Executable” 错误
  • 【C++算法】4.双指针_快乐数
  • redis 中IO多路复用与Epoll函数
  • 结合了LLM(大语言模型)的编辑器,不仅能理解人类语言,还能与用户互动,仿佛有了自己的思想。...
  • [倍福PLC]TwinCAT标准数据类型
  • WIFI网速不够是不是光猫的“路由模式”和“桥接模式”配置错了?
  • 在CentOS 7上安装WordPress的方法
  • 深入理解 C 语言中的内存操作函数:memcpy、memmove、memset 和 memcmp
  • Leetcode 每日一题:Crack The Safe
  • OSINT技术情报精选·2024年9月第4周
  • 经典面试题目---Spring IOC容器的核心实现原理
  • 数字控制系统
  • 区块链技术简介
  • 利用QGIS将.shp文件转换成json文件
  • VR 尺寸美学主观评价-解决方案-现场体验研讨会报名
  • 简单实现log记录保存到文本和数据库
  • 【Ubuntu】apt安装时报错:不再含有 Release 文件
  • ab plc1756连接Profinet 转 EtherNet/IP 网关进行数据交互