当前位置: 首页 > article >正文

【机器学习-基础知识】统计和贝叶斯推断

1. 概率论基本概念回顾

1. 概率分布

定义: 概率分布(Probability Distribution)指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。

  • 对于离散型随机变量,使用概率质量函数来描述。
  • 对于连续型随机变量,使用概率密度函数来描述。

举例说明: 投掷一颗六面骰子,每个面上的数字(1到6)都有相同的概率(1/6)出现,这就是一个简单的概率分布例子。

2. 概率函数

定义: 概率函数(Probability Function)是指在离散型随机变量的情况下,给定一个随机变量的值时,计算该值发生的概率的函数。

公式: 对于离散型随机变量 X X X,其概率函数通常表示为 P ( X = x ) P(X=x) P(X=x),即随机变量 X X X 取某个特定值 x x x 的概率。

举例说明: 抛一枚公平的硬币,令 X X X 表示出现正面的情况,则 P ( X = 正面 ) = 0.5 P(X=\text{正面})=0.5 P(X=正面)=0.5

3. 概率分布函数(累积分布函数)

定义: 概率分布函数(Cumulative Distribution Function, CDF),也称作累积分布函数,是一个函数,它给出随机变量小于或等于某个值的概率。

公式: 对于任意实数 a a a,CDF F ( a ) = P ( X ≤ a ) F(a) = P(X \leq a) F(a)=P(Xa)

举例说明: X X X 为一个均匀分布在 [ 0 , 1 ] [0,1] [0,1] 区间上的随机变量,则 F ( x ) F(x) F(x) 对于 0 ≤ x ≤ 1 0 \leq x \leq 1 0x1 x x x,即 F ( x ) = x F(x) = x F(x)=x

在这里插入图片描述

4. 概率密度函数

定义: 概率密度函数(Probability Density Function, PDF)适用于连续型随机变量,用来描述连续型随机变量落在某个确定值附近的概率密度大小。

公式: 对于连续型随机变量 X X X,其PDF记为 f ( x ) f(x) f(x),满足条件:
∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x)dx = 1 f(x)dx=1
并且对于任意两个实数 a a a b b b ( a < b a < b a<b),随机变量 X X X 落在区间 [ a , b ] [a, b] [a,b] 内的概率由下面积分给出:
P ( a < X ≤ b ) = ∫ a b f ( x ) d x P(a < X \leq b) = \int_{a}^{b} f(x) dx P(a<Xb)=abf(x)dx

2. 统计和贝叶斯

贝叶斯公式

定义: 贝叶斯公式(Bayes’ Theorem)是一种计算条件概率的方法,它允许我们通过已知的某些条件下的事件发生的概率来更新对另一些条件下该事件发生概率的估计。

公式:
P ( A ∣ B ) = P ( B ∣ A ) ⋅ P ( A ) P ( B ) P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)
其中,

  • P ( A ∣ B ) P(A|B) P(AB) 是在事件 B 发生的情况下事件 A 发生的概率,称为后验概率
  • P ( B ∣ A ) P(B|A) P(BA) 是在事件 A 发生的情况下事件 B 发生的概率,称为后验概率
  • P ( A ) P(A) P(A) P ( B ) P(B) P(B) 分别是事件 A 和事件 B 的边际概率(无条件概率) P ( A ) P(A) P(A) 也被称为先验概率

全概率公式

定义: 全概率公式(Law of Total Probability)提供了一种方法,用于计算一个复杂事件的概率,特别是当这个事件可以被分解为几个互斥但又完全覆盖样本空间的子事件时。

公式:
如果 B 1 , B 2 , . . . , B n B_1, B_2, ..., B_n B1,B2,...,Bn 是一组互斥且穷尽的事件(即它们之间没有交集,但并集覆盖了整个样本空间),则对于任意事件 A,有
P ( A ) = ∑ i = 1 n P ( A ∣ B i ) ⋅ P ( B i ) P(A) = \sum_{i=1}^{n} P(A|B_i) \cdot P(B_i) P(A)=i=1nP(ABi)P(Bi</


http://www.kler.cn/a/588868.html

相关文章:

  • 2018年全国职业院校技能大赛高职组-计算机网络应用竞赛竞赛样题E卷
  • 【GOOGLE插件】chrome.runtime.sendNativeMessage与本地应用交互
  • Xinference大模型配置介绍并通过git-lfs、hf-mirror安装
  • 【Node.js入门笔记4---fs 目录操作】
  • 【华为OD-E卷 -121 消消乐游戏 100分(python、java、c++、js、c)】
  • 9种Python数据可视化方案,让财务数据焕发生命力
  • 基于Spring Boot的网上蛋糕售卖店管理系统的设计与实现(LW+源码+讲解)
  • 谷云科技RestCloud智能体搭建平台助力企业快速搭建AI Agent
  • spring boot连接clickhouse集群,实现故障节点自动切换
  • Python基于深度学习的多模态人脸情绪识别研究与实现
  • 【TCP】三次挥手,四次挥手详解--UDP和TCP协议详解
  • 【LeetCode110】平衡二叉树
  • 爬虫获取 item_get_video 接口数据:小红书笔记视频详情的深度解析
  • Docker 端口映射的 “隐藏炸弹“ 与安全访问方案
  • 第二十七天 实践分布式任务调度,实现一个简单的分布式任务
  • Linux内核邻接子系统分析
  • PHP与前端框架的无缝集成:最佳实践与案例分析
  • 【Linux篇】初识Linux指令(下篇)
  • 【部署】ubuntu部署olmOCR
  • DICT领域有哪些重要的技术标准和规范?