机械学习—零基础学习日志(概率论总笔记4)
引言
概率论的很多用途和思想方法,但是大多数结论和方法都是从经验出发得到的。数学并不依赖于经验,这也是早期概率论所面临的一种尴尬局面。
定义是概率论的最大漏洞
拉普拉斯的古典概率论里,他对概率定义的方法是有漏洞的,发生了循环定义,在介绍随机事件A的概率时,用了等可能性的单位事件这样的说法。但是概率还没定义清楚,怎么能用等可能性的单位事件呢?
后来学者提出建立在统计基础上的统计概率。
比如,要确认一个骰子六点朝上的概率是否为1/6,就要进行大量独立的试验,看看最后六点朝上发生的次数和试验次数的比值是否等于1/6。
如果这个随机事件真的存在一个确定的概率,随着试验次数的增加,六点朝上的比例会在一个特定的值上下浮动,并且趋近于某个极限值。这个极限值被称为统计概率,如果试验次数足够多,六点朝上的频率最终就会趋近于1/6。
不过要进行多少次试验,概率才算准确?置信度要高到多少才是概率本身呢?
19世纪中期,俄罗斯数学家切比雪夫提出了一个更严格的关于大数定理的版本,他只要求一个随机变量X,进行大量的随机试验后,结果的平均值和方差是恒定的就可以了。而那个平均值,就可以作为它的概率。
概率论简单公理
定义一个样本空间,它包含我们要讨论的随机事件所有可能的结果。
定义一个集合,它包含我们所要讨论的所有随机事件,比如掷骰子不超过4点的情况是一个随机事件,掷骰子结果为偶数点的情况也是,或者干脆就是得到5点的情况,所有这些随机事件自然可以构成一个集合。
定义一个函数(也被称为测度),使集合中任何一个随机事件对应一个数值。只要这个函数满足下面三个公理,它就被称为概率函数。
以下是三个公理:
公理一:任何事件的概率是在0和1之间(包含0与1)的一个实数。
公理二:样本空间的概率为1,比如掷骰子,那么从1点朝上,到6点朝上加在一起构成样本空间,这六种情况放到一起的概率为1。
公理三:如果两个随机事件A和B是互斥的,也就是说A发生的话B一定不会发生,那么,这件事发生的概率,就是A单独发生的概率,加上B单独发生的概率。这也被称为互斥事件的加法法则。很好理解,比如掷骰子一点朝上和两点朝上显然是互斥事件,一点或两点任意一种情况发生的概率,就等于只有一点朝上的概率,加上只有两点朝上的概率。
学习笔记:《数学通识50讲》吴军 ——得到 ,概率论章节
墙裂推荐大家去学习《数学通识50讲》,吴军老师讲解得超级超级好!