当前位置: 首页 > article >正文

机器学习——欧式距离、闵氏距离、马氏距离、曼哈顿距离、切比雪夫距离(自用)

距离度量方式:在机器学习和数据分析中,距离度量衡量特征空间中的两个实例之间的相似度常用的距离计算方式:欧几里得距离(欧式距离)、闵氏距离、马氏距离、曼哈顿距离、切比雪夫距离

①欧几里得距离公式(Euclidean Distance)

其定义为多维空间中两点间的直线距离

其公式为:

其缺点是对异常值敏感,当出现各个特征的量纲差异较大时,容易出现分类准度下降,故在使用之前需要对数据标准化(Z-score用于消除数据量纲(单位)差异,使得不同特征的数据具有可比性)

②闵氏距离(Minkowski Distance,又称闵可夫斯基距离)

其定义为欧式距离的泛化形式,通过参数p调节距离计算方式

其公式为:

这个公式相当厉害,将其他范数都囊括进来了,比如通过一个p参数就实现将曼哈顿距离、欧式距离、切比雪夫距离包含在内。

当p=1时,其为曼哈顿距离公式,用于做路径规划、网格路径计算

当p=2时,其为欧式距离公式,

当p->无穷时,其为切比雪夫距离公式,用于棋盘游戏

 ③马氏距离(Mahalanobis Distance,又称马哈拉诺比斯距离)

其定义考虑数据协方差结构的标准化距离,消除特征相关性和量纲的影响

其公式为:

可以看出当Σ 为协方差矩阵为单位矩阵(样本各特征之间相互独立且方差为1)时,其就变成了欧式距离公式。

其常用于分类任务(LDA)、异常检测、多元统计分析

补充知识:协方差是衡量两个变量之间的线性关系的统计量,正值表示正相关,负值表示负相关,零表示无线性相关。即反映两个变量的变化趋势是否一致


http://www.kler.cn/a/611248.html

相关文章:

  • 哪个进程通信效率高
  • Vue 中异步数据加载与方法调用顺序问题:`await` 的正确使用
  • golang不使用锁的情况下,对slice执行并发写操作,是否会有并发问题呢?
  • OPPO手机如何实时翻译会议视频?视频翻译轻松应对多语言场景
  • ES 字段的映射定义了字段的类型及其行为
  • 拥抱人工智能大模型时代:大模型会改变我们的生活吗?
  • 接口自动化进阶 —— Pytest全局配置pytest.ini文件详解!
  • 用PostgreSQL玩转俄罗斯方块:当SQL成为游戏引擎
  • 获取表单元素的方式
  • HarmonyOs-ArkUI List组件
  • macos设置docker可以ping通容器
  • 使用逆滤波法、维纳滤波法、约束最小二乘法、Lucy - Richardson算法恢复运动降质图像的Matlab代码
  • 群体智能优化算法-蜻蜓优化算法(Dragonfly Algorithm, DA,含Matlab源代码)
  • RedisTemplate和RedissonClient适用的场景有什么不同
  • C++20:玩转 string 的 starts_with 和 ends_with
  • CAJ转PDF:复杂的转换背后有哪些挑战?
  • Python----计算机视觉处理(Opencv:凸包特征检测:凸包方法)
  • Modbus TCP转ProfiNet协议转换网关构建三菱L系列PLC与伺服的冗余通信架构
  • 基于Spring Boot的乡村养老服务管理系统的设计与实现(LW+源码+讲解)
  • 深度学习框架中动态图和静态图是什么意思,如何通过keras和estmator实现?