与机器学习相关的概率论重要概念的介绍和说明
概率论一些重要概念的介绍和说明
1、 试验
(1)试验是指在特定条件下,对某种方法、技术、设备或产品(即,事物)进行测试或验证的过程。
(2)易混淆的概念是,实验。实验,是指在受控条件下,为验证或探索某种科学假设、理论或自然规律而进行的系统性试验。即,实验是特殊的试验。
(3)试验和实验的区别有两个方面。A,第一个方面是目的,实验常用于验证科学假设或探索自然规律,而试验用于检验方法,事物的效果和可行性。B,第二个方面是控制条件,试验的控制条件相对宽松,它注重实际结果。而,实验有严格的限制和数据精确度。
2、 随机试验
随机试验是特定的试验,它具有三个特点,(1)可以在相同条件下重复,且是可观察的;(2)所有结果是已知的;(3)在试验前,试验结果是未知的。
3、 随机事件/事件
事件,是时间对象或对象中属性的实例化。
随机事件,是随机试验中可能发生也可能不发生的事件。随机事件的数学化表示是样本空间的子集。其中,样本空间是所有样本点的集合,样本点是指随机试验的基本结果。
4、 随机现象/现象
A,现象是客观事物的可观测的表现或可观测的事件。
B,随机现象是指在重复的随机试验中,不可预知但呈现统计规律的现象。即,它是指在重复的随机试验中,不可预知但呈统计规律的许多事件(复数)或事物的许多表现。
C,总结,也就是说,通过对事件的总结,我们根据规律得出了随机现象。
5、 概率
概率是指一个事件在给定条件下发生的可能性大小。
6、 概率模型
A,概率模型是用来描述不同类型的随机现象的模型,其中,模型包括事件的概率计算公式等。因为一些随机现象是异构的,例如,有些样本空间是离散,有的是连续的。有些场景中,概率是通过计数(即,计算出现的次数)来计算,例如,投骰子。而,有些场景是通过几何度量(即,面积,长度等)来计算,例如,投飞镖。
B,常见的概率模型有,经典概率模型,几何概率模型。
7、 随机变量
随机变量是指,随机事件结果的数值映射,即,一个函数。即,它为每个随机事件指定一个数值。概率论中,存在离散型,连续型和非离散非连续的随机变量。
8、 分布律/概率质量函数/概率密度函数
A,分布律是用于描述各个离散型随机变量的概率数值的表格。
B,概率质量函数是关于离散型随机变量的函数,它描述了每个离散型随机变量对应的随机事件的结果(即,出现多个样本点)的概率。
C,概率密度函数是关于连续型随机变量的函数,它描述了一系列无限的随机变量在不同区间内取值的概率,其中,区间是指,一个随机变量对应的单位尺度,如,单位面积,单位长度,这个单位尺度可以根据研究的问题而自适应地被划分,可能分的很细,也可能很宽。
注意1:概率质量函数是以每个离散点为衡量尺度,即,“点”( 事件点),而不是以“区间”。
注意2:单位面积的概率,类似于单位时间的速度,单位体积的密度
9、 分布函数
分布函数是表示多个随机变量X的概率的累加,这些随机变量的取值小于等于x。