当前位置: 首页 > article >正文

pandas中基于范围条件进行表连接

pandas中基于范围条件进行表连接

来自:Python大数据分析 费弗里

表连接是我们日常开展数据分析过程中很常见的操作,在pandas中基于join()merge()等方法,可以根据左右表连接依赖字段之间对应值是否相等,来实现常规的表连接。

但在有些情况下,我们可能需要基于一些“特殊”的条件匹配,来完成左右表之间的表连接操作,譬如对于下面的示例数据框demo_leftdemo_right

假如我们需要基于demo_leftleft_id等于demo_rightright_id,且demo_leftdatetimedemo_rightdatetime之间相差不超过7天,这样的条件来进行表连接,「通常的做法」是先根据left_idright_id进行连接,再在初步连接的结果表中基于left_idright_id进行分组筛选运算,过滤掉时间差大于7天的记录:

而除了上面的方式以外,我们还可以基于之前的文章中给大家介绍过的pandas的功能拓展库pyjanitor中的「条件连接方法」,直接基于范围比较进行连接,且该方式还支持numba加速运算:


http://www.kler.cn/a/302898.html

相关文章:

  • 网络技术-定义配置ACL规则的语法和命令
  • Linux git-bash配置
  • HTTP常见的请求头有哪些?都有什么作用?在 Web 应用中使用这些请求头?
  • DNS面临的4大类共计11小类安全风险及防御措施
  • C++单例模式实现
  • unity基础,点乘叉乘。
  • JAVA开源项目 校园管理系统 计算机毕业设计
  • C++基础知识6 vector
  • 装饰器模式decorator
  • 3. 轴指令(omron 机器自动化控制器)——>MC_HomeWithParameterMC_Move
  • 怎么给DataX的Json配置文件传参
  • java后端请求调用三方接口
  • 【Hot100】LeetCode—763. 划分字母区间
  • C++战列舰小游戏Lv. 1.4版本(半成品)
  • 【STM32实物】基于STM32设计的18650锂电池电量(电压/电流)检测系统——采用电阻分压法、均值滤波及ADC测量—文末工程资料下载
  • 在Linux中从视频流截取图片帧(ffmpeg )
  • 西门子1200/1500PLC什么时候需要设置网关地址
  • TCP全连接队列和tcpdump抓包
  • MinIO【部署 02】Linux集群版本及Windows单机版、单机多目录版、分布式版(cmd启动脚本及winsw脚本分享)
  • 模版方法模式template method
  • CMU 10423 Generative AI:lec3(Learning Large Language Models)
  • vim 安装与配置教程(详细教程)
  • Linux学习-Ansible(二)
  • 解码企业数字化转型的四大核心促因
  • 数据结构加餐:三路划分、自省排序、文件归并排序
  • vue3 使用swiper制作带缩略图的轮播图