当前位置: 首页 > article >正文

R整理数据技巧

根据姓名和日期排序后,给一列排序号

df %>%
	arrange(姓名, 日期) %>%
	group_by(姓名) %>%
 	mutate(record_rank = row_number()) %>%
  	dplyr::ungroup()

如果事件1出现后,后面所有的值用NA填充

针对在进行整理生存分析数据时

df %>%
  arrange(姓名, record_rank) %>%
  group_by(姓名) %>%
  mutate(mark = cumsum(status == 1)) %>%
  mutate(new_status = if_else(mark <= 1, status, NA)) %>%
  ungroup() %>%
  mutate(new_status = ifelse(is.na(new_status), 0, new_status))

向上或向下填充NA值

df %>% 
  group_by(姓名) %>% 
  fill(feature1, .direction = 'up') %>%
  fill(feature1, .direction = 'down')

http://www.kler.cn/a/325589.html

相关文章:

  • 【Java SE】PreparedStatement
  • 聚焦 NLP 和生成式 AI 的创新与未来 基础前置知识点
  • Spring Boot中集成Redis与MySQL
  • 【MYSQL】锁详解(全局锁、表级锁、行级锁)【快速理解】
  • 商业物联网详细指南:优势与挑战
  • 数据库基本概念学习笔记
  • 解决sortablejs+el-table表格内限制回撤和拖拽回撤失败问题
  • Redis string类型hash类型
  • 在pycharm中怎样调试HTML网页程序
  • B-树(不是B减树)原理剖析(1)
  • 有些硬盘录像机接入视频汇聚平台EasyCVR后通道不显示/显示不全,该如何处理?
  • Qt 学习第十一天:QTableWidget 的使用
  • 启动hadoop集群出现there is no HDFS_NAMENODE_USER defined.Aborting operation
  • 基于HTML、CSS和JavaScript的滚动数字显示效果,类似于老式计数器或电子表上的数字滚动效果
  • JAVA并发编程高级——JDK 新增的原子操作类 LongAdder
  • 渗透测试实战—教育攻防演练信息收集
  • Bugku 渗透测试1
  • 03. 前端面试题之ts : typescript 的数据类型有哪些?
  • LeetCode 热题 100 回顾2
  • 3种方法解决Docker容器中配置运行环境问题
  • 使用Python实现图形学的法线映射算法
  • 磁盘管理器
  • Qt网络编程——QUdpSocket
  • golang学习笔记24-文件操作
  • 实用好软-----电脑端 从视频中导出音频的方便工具
  • 微信小程序-数据模型与动态赋值