当前位置: 首页 > article >正文

数据挖掘——朴素贝叶斯分类

数据挖掘——朴素贝叶斯分类

  • 朴素贝叶斯分类
    • 极大后验假设
    • 独立性假设
    • 贝叶斯分类器总结

朴素贝叶斯分类

什么是分类?

  • 找出描述和区分数据类或概念的模型,以便能够使用模型预测未知的对象的类标号

概念区分

  • 分类与回归
    • 分类是预测分类(离散、无序)标号
    • 回归建立连续值函数模型

分类与聚类

  • 分类是有监督学习,提供了训练元组的类标号
  • 聚类是无监督学习,不依赖有类标号的训练实例

极大后验假设

  • 极大后验假设定义:学习器在候选假设集合H中寻找给定数据D时可能性最大的假设h,h被称为极大后验假设(Maximumaposteriori:MAP)

  • 确定MAP的方法是用贝叶斯公式计算每个候选假设的后验概率,计算式如下:
    h M A P = max ⁡ h ∈ H P ( h ∣ D ) = max ⁡ h ∈ H P ( D ∣ h ) P ( h ) / P ( D ) = max ⁡ h ∈ H P ( D ∣ h ) P ( h ) h_{M A P}=\max _{h \in H} P(h \mid D) =\max _{h \in H} \mathrm{P}(D \mid h) \mathrm{P}(h) / P(D)=\max _{h \in H} \mathrm{P}(D \mid h) \mathbf{P}(\mathrm{h}) hMAP=hHmaxP(hD)=hHmaxP(Dh)P(h)/P(D)=hHmaxP(Dh)P(h)
    在这里插入图片描述
    在这里插入图片描述
    计算 P < a 1 , a 2 , … , a n > ∣ h ) P<a_1,a_2,…,a_n > | ℎ) P<a1,a2,,an>h) 时,当维度过高时,可用数据变得很稀疏,难以获得结果。

独立性假设

假设D的属性𝐚𝐢之间相互独立
在这里插入图片描述
优点

  • 获得估计的 P ( a i ∣ h ) P(a_i | h ) P(aih) P ( < a 1 , a 2 , … , a n > ∣ h ) P(<a_1,a_2,…,a_n > | h ) P(<a1,a2,,an>h)容易很多
  • 如果D的属性之间不满足相互独立,朴素贝叶斯分类的结果是贝叶斯分类的近似

贝叶斯分类器总结

本质上是同时考虑了先验概率和似然概率的重要性

特点

  • 属性可以离散、也可以连续
  • 数学基础坚实、分类效率稳定
  • 对缺失和噪声数据不太敏感
  • 属性如果不相关,分类效果很好

http://www.kler.cn/a/464065.html

相关文章:

  • 人工智能之机器学习算法
  • 【Pytorch报错】AttributeError: cannot assign module before Module.__init__() call
  • (二)当人工智能是一个函数,函数形式怎么选择?ChatGPT的函数又是什么?
  • 呼叫中心中间件实现IVR进入排队,判断排队超时播放提示音
  • 迟来的前端面试经验
  • 树莓派 Pico RP2040 教程点灯 双核编程案例
  • 滑动窗口——将x减到0的最小的操作数
  • 长时间序列预测算法---Informer
  • Cocos游戏中集成RichTap高品质振动
  • SpringCloud微服务架构
  • selenium 确保页面完全加载
  • react 优化方案
  • vue设计与实现-权衡的艺术
  • 打造三甲医院人工智能矩阵新引擎(一):文本大模型篇--基于GPT-4o的探索
  • SpringBoot开发——常用的几种参数传递和参数接收方式
  • js 中的递归应用+异步递归
  • Ungoogled Chromium127编译指南 Linux篇 - 拉取仓库(七)
  • IP-Guard对SolidWorks PDM 加密授权说明
  • Linux 系统中 .d 目录有什么用?
  • 电视广播制式:N制与P制
  • Guava常见特性操作
  • node.js 浅析 与 了解
  • 【视觉SLAM:十一、设计SLAM系统】
  • 人大金仓数据库基于Linux系统的数据库软件安装指南
  • PlantUML 时序图 基本例子
  • 民宿酒店预订系统小程序+uniapp全开源+搭建教程