当前位置: 首页 > article >正文

K-Means算法进行分类

已知数据集D中有9个数据点,分别是(1,2),(2,3), (2,1), (3,1),(2,4),(3,5),(4,3),(1,5),(4,2)。采用K-Means算法进行聚类,k=2,设初始中心点为(1.1,2.2),(2.3,3.5)。 试模拟K-Means算法的一次迭代过程,即先计算样本点到类中心点的距离,然后把样本点划分到最近的类中,最后更新类中心点的坐标
数据集合D:{(1,2),(2,3),(2,1),(3,1),(2,4),(3,5),(4,3),(1,5),(4,2)} 初始中心点: C1=(1.1,2.2),C2=(2.3,3.5) 计算每个数据点到两个中心点的距离,并将其划分到距离最近的类中。假设我们使用欧氏距离:

在这里插入图片描述

计算每个数据点到两个中心点的距离:
在这里插入图片描述

将每个数据点划分到距离最近的类中。这里我们用1和2表示两个类:
C={1,2,1,1,2,2,2,2,2}

更新类中心点的坐标,即计算每个类的均值:
C1=((1+2+3)/3,(2+1+1)/3)≈(2,1.3)
C2=((2+2+3+4+1+4)/6,(3+4+5+3+5+2)/6))≈(2.6,3.6)

新的中心点更新为(2,1.3)和(2.6,3.6) 依次迭代直到发现没有重新分配或者准则函数收敛程序结束

http://www.kler.cn/news/133759.html

相关文章:

  • 2342. 数位和相等数对的最大和 --力扣 --JAVA
  • MySQL数据库下的Explain命令深度解析
  • 自动驾驶学习笔记(九)——车辆控制
  • .NET 8 正式 GA 遥遥领先
  • kaggle新赛:SenNet 3D肾脏分割大赛(3D语义分割)
  • windows 安装 Oracle Database 19c
  • WPF如何实现应用程序托盘
  • 【算法日志】图论 并查集及其简单应用
  • [C国演义] 哈希的使用和开闭散列的模拟实现
  • 【网络通信】探索UDP与TCP协议、IP地址和端口号的奥妙
  • 计算机科学速成课
  • 单链表在线OJ题(详解+图解)
  • vscode文件夹折叠问题
  • 音视频项目—基于FFmpeg和SDL的音视频播放器解析(六)
  • 多线程(初阶)
  • 【IPC】消息队列
  • 针对CSP-J/S的每日一练:Day9
  • Sqlite安装配置及使用
  • vscode中Chinese (Simplified)汉化无效解决方法
  • 我叫:选择排序【JAVA】
  • 教程:使用 Keras 优化神经网络
  • qml制作简单的播放器--MediaPlayer
  • 如何使用贝锐花生壳内网穿透远程访问JupyterNotebook?
  • springboot项目yml文件中使用${}配置
  • linux下安装python3.8(有坑)
  • ping命令使用示例解析
  • ubuntu20.04在docker下运行ros-noetic进行开发
  • 【电路笔记】-最大功率传输
  • vulhub redis-4-unacc
  • ​软考-高级-系统架构设计师教程(清华第2版)【第14章 云原生架构设计理论与实践(P496~526)-思维导图】​