当前位置: 首页 > article >正文

【机器学习】26. 聚类评估方法

聚类评估方法

  • 1. Unsupervised Measure
    • 1.1. Method 1: measure cohesion and separation
      • Silhouette coefficient
    • Method 2:Correlation between two similarity matrices
    • Method 3:Visual Inspection of similarity matrix
  • 2. Supervised measures
  • 3. 决定cluster的数量
  • 4. 确定聚类趋势

1. Unsupervised Measure

  • 一个集群内的相似性高,集群之间的相似性低
  • 这些措施也被称为internal

1.1. Method 1: measure cohesion and separation

cohesion 和separation使用距离测量
cohesion :每个点与集群中心的距离(曼哈顿)
整体cohesion :直接相加

separation:每个类的中心的距离
整体separation:乘以数量权重再相加

在这里插入图片描述
也可以用平方距离 名字改成SSE BSE

Silhouette coefficient

对于某个点i:
a_I: 点i到簇内所有其他点的平均距离, 代表凝聚度
b_i: 首先找到点i到另一个簇中所有点的平均距离, 然后取这些平均距离的最小值
在这里插入图片描述
s的范围是[−1,1],越高越好

Method 2:Correlation between two similarity matrices

• 第一个相似度矩阵从距离得出
• 第二个相似度矩阵从聚类结果得出 0 不同,1相同
计算这两个相似度矩阵的相关性.

Method 3:Visual Inspection of similarity matrix

Plot the similarity matrix using coloring based on the similarity
在这里插入图片描述
主对角线的块状结构越清晰越好

2. Supervised measures

  • 将聚类结果与“ground truth”(专家提供的正确聚类标签)进行比较
  • 也叫External

3. 决定cluster的数量

elbow method
运行几个k的聚类算法,绘制SSE或其他无监督度量与簇的数量
寻找明显的膝盖或峰=大量的集群
在这里插入图片描述

4. 确定聚类趋势

Hopkins statistic


http://www.kler.cn/a/375470.html

相关文章:

  • 完全透彻了解一个asp.net core MVC项目模板1
  • Linux常见命令合集
  • Kafka自动生产消息软件
  • 想给视频去背景音乐?简单几步搞定
  • Chromium HTML5 新的 Input 类型tel对应c++
  • OB_GINS_day3
  • Ubuntu 系统、Docker配置、Docker的常用软件配置(下)
  • Docker-in-Docker(DinD)
  • 4:arm汇编语言4:bits/byte的介绍(ASCII码)与二进制补位
  • 【数据结构】guard
  • PyMOL中常用的命令列表
  • 代理人工智能如何应对现代威胁的速度和数量
  • 重载与重写的区别
  • wireshark复制数据
  • 极简实现酷炫动效:Flutter隐式动画指南第二篇之一些酷炫的隐式动画效果
  • 高清解压视频素材从哪儿下载?推荐5个高清推文素材资源网站
  • Unity3D Shader实现法线贴图功能详解
  • 【论文阅读】FUNNELRAG:一个从粗到精的逐级检索范式
  • 静态水印+动态水印,开启超强PPT版权保护!
  • 基于Material Design风格开源、免费的WinForms UI控件库
  • DNF 主从服务器的搭建
  • 传输层协议之UDP
  • 调试EKF的MATLAB代码的关键点
  • 智能交通的未来:深度学习如何改变车辆检测游戏规则
  • 抓取和分析JSON数据:使用Python构建数据处理管道
  • 从一个双向链表中移除一个链表