当前位置: 首页 > article >正文

数据分析师之Excel数据清洗

前言

目前,掌握一定的Excel技能时,怎么通过自己的技能实现数据分析的操作,就需要进行具体项目的实战,本身数据分析这个行业是非常吃经验的,既然我们是小白入坑,就需要多做实战演练,才能够实际的拿到这一行的敲门砖

数据分析流程

分析流程:明确需求->确认思路->处理数据->分析数据->展示数据,撰写报告->效果反馈

处理数据

数据清洗:选择子集->列名重命名->删除重复值->缺失值处理->一致化处理

删除重复值:找到不可重复的字段(例如ID之类),观察重复值是否完全一致,后保留唯一项

缺失值处理:缺失值数量较少,可直接删除该行数据;文本型,如果和其他列有关联关系(如省份和地州),可以自行判断填充,若实在无关联关系,可以放弃该维度的分析;缺失值数量大,数值型进行填充(均值、中位数)

一致化处理:对于某些数据列,需要规范数据类型之类的内容

异常值处理:对于某些数据是不符合需求要求的数据可以进行剔除


http://www.kler.cn/a/320619.html

相关文章:

  • Java基础-组件及事件处理(中)
  • Linux-何为CentOS
  • Spring Events在大型项目中的最佳实践
  • MySQL技巧之跨服务器数据查询:基础篇-A数据库与B数据库查询合并--封装到存储过程中
  • 深度学习笔记14-卷积神经网络2
  • Excel SUMIFS
  • 开始场景的制作+气泡特效的添加
  • 【Webpack】实现持久化缓存
  • 两台虚拟机之分布式部署
  • 如何理解MVCC
  • .net 之内存回收
  • 阿里云服务器发布node服务后,连接不上
  • 简单分享下Python的if
  • 华为HarmonyOS灵活高效的消息推送服务(Push Kit) - 4 获取Push Token
  • 科研绘图系列:R语言连线点图(linechart dotplot)
  • 浅析安科瑞Acrel-1000DP分布式光伏监控系统在某煤矿5MW分布式光伏项目中的应用-安科瑞 蒋静
  • [mongodb][配置]MongoDB中限制内存
  • Ceph官方文档_02_Ceph初学者指南
  • 功能测试详解
  • npm run serve报错提示js堆内存不足
  • elastic search后端安装方法(服务端)
  • DCGAN生成人脸图片
  • g1:基于 Llama,用提示工程实现类似 o1 的深度推理
  • SpringBoot 与 Maven 快速上手指南
  • 使用Fiddler Classic抓包工具批量下载音频资料
  • 从HarmonyOS Next导出手机照片