当前位置：首页 > article >正文

【机器学习】23. 聚类-GMM: Gaussian Mixture Model

article 2025/4/2 9:11:42

1. 定义和假设

定义：probabilistic clustering（model-base）
假设：数据服从正态分布
在这里插入图片描述

我们假设数据是由k个高斯（正态）分布混合生成的。每个分布有2个参数：μ和σ。
一个分布对应一个集群
从u和o的随机初始值开始
在每次估计后，我们计算每个例子属于每个分布（簇）的概率
利用概率，我们重新计算参数，直到它们不变。

假设有20000个数据点，两个高斯分布，两个标准差都是2，使用GMM聚类。

k-means: crisp(hard)-assignment
GMM – probabilistic(soft assignment)
GMM可以看作是k均值的泛化
GMM更灵活。允许椭圆的cluster而不是圆形

AI直播带货场景切换模块的搭建!

方法重写与方法重载

使用知识付费小程序能获益？

python mac vscode 脚本文件的运行

【02基础】- RabbitMQ基础

element-plus校验单个form对象合法性

ctfshow(89,90)--PHP特性--intval函数

从0学习React（10）

opencv优秀文章集合