当前位置: 首页 > article >正文

评价聚类的方法

inertias:inertias是K均值模型对象的属性,表示样本距离最近的聚类中心的总和,它是作为在没有真实分类结果标签下的非监督式评估指标。该值越小越好,值越小证明样本在类间的分布越集中,即类内的距离越小。

adjusted_rand_s:调整后的兰德指数(Adjusted Rand Index),兰德指数通过考虑在预测和真实聚类中在相同或不同聚类中分配的所有样本对和计数对来计算两个聚类之间的相似性度量。调整后的兰德指数通过对兰德指数的调整得到独立于样本量和类别的接近于0的值,其取值范围为[-1, 1],负数代表结果不好,越接近于1越好意味着聚类结果与真实情况越吻合。

mutual_info_s:互信息(Mutual Information, MI),互信息是一个随机变量中包含的关于另一个随机变量的信息量,在这里指的是相同数据的两个标签之间的相似度的量度,结果是非负值。

adjusted_mutual_info_s:调整后的互信息(Adjusted Mutual Information, AMI),调整后的互信息是对互信息评分的调整得分。它考虑到对于具有更大数量的聚类群,通常MI较高,而不管实际上是否有更多的信息共享,它通过调整聚类群的概率来纠正这种影响。当两个聚类集相同(即完全匹配)时,AMI返回值为1;随机分区(独立标签)平均预期AMI约为0,也可能为负数。

homogeneity_s:同质化得分(Homogeneity),如果所有的聚类都只包含属于单个类的成员的数据点,则聚类结果将满足同质性。其取值范围[0,1]值越大意味着聚类结果与真实情况越吻合。

completeness_s:完整性得分(Completeness),如果作为给定类的成员的所有数据点是相同集群的元素,则聚类结果满足完整性。其取值范围[0,1],值越大意味着聚类结果与真实情况越吻合。

v_measure_s:它是同质化和完整性之间的谐波平均值,v = 2 (均匀性完整性)/(均匀性+完整性)。其取值范围[0,1],值越大意味着聚类结果与真实情况越吻合。

silhouette_s:轮廓系数(Silhouette),它用来计算所有样本的平均轮廓系数,使用平均群内距离和每个样本的平均最近簇距离来计算,它是一种非监督式评估指标。其最高值为1,最差值为-1,0附近的值表示重叠的聚类,负值通常表示样本已被分配到错误的集群。

calinski_harabaz_s:该分数定义为群内离散与簇间离散的比值,它是一种非监督式评估指标。


http://www.kler.cn/a/106559.html

相关文章:

  • [GXYCTF2019]BabyUpload--详细解析
  • MFC中Picture Control控件显示照片的几种方式
  • A030-基于Spring boot的公司资产网站设计与实现
  • Vue3中一级导航栏的吸顶导航交互以及Pinia优化重复请求
  • 深度学习在边缘检测中的应用及代码分析
  • 解决failed to execute PosixPath(‘dot‘) 或者GraphViz‘s executables not found
  • Java提升技术,进阶为高级开发和架构师的路线
  • 日志logback详解
  • 虚拟机安装openEuler系统
  • Kafka集群搭建与SpringBoot项目集成
  • 零基础Linux_22(多线程)线程控制和和C++的多线程和笔试选择题
  • 【系统架构设计】 架构核心知识: 2 云原生架构
  • IBM展示非冯·诺依曼架构AI芯片NorthPole
  • 移动端之Unity嵌入Android项目开发
  • 【递归汇总】前端各种递归方法记录合集
  • go WriteFile文件追加写入(适合小文件)
  • 分享8个分布式Kafka的使用场景
  • 计算机毕业设计 基于SpringBoot大学生创新创业项目管理系统的设计与实现 Javaweb项目 Java实战项目 前后端分离 文档报告 代码讲解 安装调试
  • 一、XSS加解密编码解码工具
  • K8s概念汇总-笔记
  • C嘎嘎之类和对象中
  • 使用pytest和allure框架实现自动化测试报告优化
  • 自动化工具-文件清单对比
  • React之服务端渲染
  • Mask Free VIS笔记(CVPR2023 不需要mask标注的实例分割)
  • 腾讯云轻量应用服务器简介_轻量服务器购买指南