数据分析师之Excel数据清洗
前言
目前,掌握一定的Excel技能时,怎么通过自己的技能实现数据分析的操作,就需要进行具体项目的实战,本身数据分析这个行业是非常吃经验的,既然我们是小白入坑,就需要多做实战演练,才能够实际的拿到这一行的敲门砖
数据分析流程
分析流程:明确需求->确认思路->处理数据->分析数据->展示数据,撰写报告->效果反馈
处理数据
数据清洗:选择子集->列名重命名->删除重复值->缺失值处理->一致化处理
删除重复值:找到不可重复的字段(例如ID之类),观察重复值是否完全一致,后保留唯一项
缺失值处理:缺失值数量较少,可直接删除该行数据;文本型,如果和其他列有关联关系(如省份和地州),可以自行判断填充,若实在无关联关系,可以放弃该维度的分析;缺失值数量大,数值型进行填充(均值、中位数)
一致化处理:对于某些数据列,需要规范数据类型之类的内容
异常值处理:对于某些数据是不符合需求要求的数据可以进行剔除