当前位置: 首页 > article >正文

数据分析及应用:如何分析基于绝对中位差的异常值检测问题?

目录

0 场景描述

1 数据准备 

2 问题分析

 abs(rn - (cnt+1)/2) < 1

3 小结


0 场景描述

数据集中可能存在异常的值。值存在异常有多种原因:

  • (1)可能是数据收集方式有问题,比如记录值的仪表存在误差;
  • (2)可能是数据输入错误导致的;
  • (3)还可能是因为数据生成时环境出现异常,这意味着数据点是正确的,但应谨慎根据数据得出任何结论。

鉴于此,我们想检测出异常数据。一种检测异常数据的常用方法是,计算数据的标准偏差,并将超过3 倍标准偏差(或其他类似距离)的数据点视为异常数据。

在统计学中,我们把这种检测异常值的方式称为 中位数绝对偏差(Median Absolute Deviation,MAD) 的方法,可以用来识别异常值并将其排除在外。MAD是一种基于中位数的离散度量,它可以帮助识别数据集中的异常值。

公式如下: 


http://www.kler.cn/a/288489.html

相关文章:

  • 【安全通信】告别信息泄露:搭建你的开源视频聊天系统briefing
  • [运维][Nginx]Nginx学习(1/5)--Nginx基础
  • CSS多列布局:打破传统布局的束缚
  • jmeter常用配置元件介绍总结之定时器
  • AI 扩展开发者思维方式:以 SQL 查询优化为例
  • 【AI大模型】ELMo模型介绍:深度理解语言模型的嵌入艺术
  • LINUX网络编程:Tcpsocket封装
  • Java GC机制:Minor GC与Full GC的触发条件
  • 假期作业--数据结构
  • uniapp插槽用法
  • vue子组件样式影响父组件
  • 每天一个数据分析题(五百一十六)- 贝叶斯分类算法
  • Axure打造科技感数据可视化大屏原型
  • 网络安全宗旨和目标
  • OpenCV颜色空间转换(1)颜色空间转换函数cvtColor()的使用
  • 【论文阅读】skill code 和 one-shot manipulate
  • C++ 设计模式——职责链模式
  • Go父类调用子类方法(虚函数调用)
  • stm32之I2C通信外设
  • 提升RAG检索回答质量: Shortwave的 4 大优化指南
  • 使用 Milvus Lite、Llama3 和 LlamaIndex 搭建 RAG 应用
  • 住宅IP与机房IP:哪种更适合业务应用?
  • 51单片机-第十节-独立按键及数码管优化
  • shell脚本—————局域网IP扫描
  • 开放式耳机漏音有多大?五大超值爆款推荐!
  • 【数据可视化技术】使用Matplotlib、Seaborn进行数据可视化