当前位置: 首页 > article >正文

什么是数据分析

数据分析是通过总结数据的规律来解决业务问题。数据分析包括如下几个主要内容:

现状分析:分析现在发生了什么

原因分析:分析为什么会发送这种情况

预测分析:预测未来会出现什么

数据分析的基本流程:获取数据,数据处理,数据分析,验证结果

数据处理是从大量的、杂乱的、缺失的数据中抽取出对解决问题有意义的数据。

数据处理包括数据规约、数据清洗、数据加工

数据规约:保证数据完整性的同时减小数据的规模,提高数据处理速度

数据清洗:

  • 数据探索分析:统计判断数据是否存在缺失异常的情况
  • 缺失数据处理:对于缺失数据,如果较多直接删除。如果不多,可以填充,用0或者均值填充
  • 异常数据处理:对于不符合常理的数据进行删除

数据加工:

  • 数据抽取:选取数据部分内容
  • 数据计算:通过各种算法,得到进一步信息
  • 数据分组:按照有关信息进行分组
  • 数据转换:数据标准化处理,比如z_score标准


http://www.kler.cn/a/152072.html

相关文章:

  • Python的正则表达式使用
  • 触底加载上拉刷新
  • CentOS 7安装Java 8
  • Linux 系统渗透提权-Server2204
  • flink消费kafka限制消费速率
  • 【ARM CoreLink 系列 8.1 -- SMMU 详细介绍-STE Entry 详细介绍 1】
  • 通用plantuml模板头
  • Spring三级缓存处理循环依赖的过程
  • 10.30 作业 C++
  • 【NGINX--10】高可用性部署模式
  • 万户ezOFFICE wpsservlet任意文件上传漏洞复现
  • centos7配置tomcat
  • 阅读文献总结2023
  • CTA-GAN:基于生成对抗性网络的主动脉和颈动脉非集中CT血管造影 CT到增强CT的合成技术
  • MySQL 大表设计
  • Echarts 柱状图添加标记 最大值 最小值 平均值
  • 【开题报告】基于SpringBoot的在线打印预约系统的设计与实现
  • 学习笔记:Pytorch 搭建自己的Faster-RCNN目标检测平台
  • 【双向链表的实现】
  • JS设计模式 — 行为委托