ML 系列:第 26 节 - 连续概率分布(均匀分布)
文章目录
- 一、说明
- 二、均匀分布
- 三、连续均匀分布的概率密度函数
- 四、连续均匀分布的性质
- 五、与其他分布版的比较
- 六、结束语
一、说明
均匀分布是一种概率分布,其中定义范围内的每个值都有相同的发生概率。换句话说,所有可能的结果都有相同的概率。这种分布的特点是概率密度函数平坦或恒定。
二、均匀分布
均匀分布有两种类型:离散和连续。在离散均匀分布中,结果仅限于一组有限的值,例如掷一个公平的六面骰子,其中每个数字出现的概率均等。另一方面,连续均匀分布的结果可以取指定范围内的任何值,例如 0 到 1 之间的随机变量的分布。
两者的区别在于结果的性质。离散均匀分布处理可数结果,而连续均匀分布处理不可数结果。
三、连续均匀分布的概率密度函数
连续均匀分布的概率密度函数为:
绘制连续均匀分布的概率密度函数 (PDF) 的 Python 代码,其下限为“a”,上限为“b”:
import numpy as np
import matplotlib.pyplot as plt
def continuous_uniform_pdf(x, a, b):
if a <= x <= b:
return 1 / (b - a)
else:
return 0
# Define the range of values for x
x_values = np.linspace(0, 5, 100)
# Define the parameters for the continuous uniform distribution
a = 1
b = 4
# Calculate the PDF values for each x value
pdf_values = [continuous_uniform_pdf(x, a, b) for x in x_values]
# Plot the Probability Density Function (PDF) of the continuous uniform distribution
plt.plot(x_values, pdf_values, color='blue')
plt.title('Continuous Uniform Distribution PDF')
plt.xlabel('x values')
plt.ylabel('Probability Density')
plt.grid(True)
plt.show()
这是上述代码的输出:
连续均匀分布的概率密度函数 (PDF) 定义为
代入 ’ a = 1 ’ 和 ’ b = 4 ',我们得到:
f(x) = 1 / (4-1) = 1 / 3(1 ≤ x ≤ 4)
因此,在这个例子中,对于“a = 1”和“b = 4”的连续均匀分布,对于 1 到 4 之间的所有值,PDF 都被计算为 1/3。
四、连续均匀分布的性质
1 范围和支持:
连续均匀分布的范围由下限“a”和上限“b”定义,表示为 [a, b]。分布的支持范围包括“a”和“b”之间的所有实数,概率均匀分布在此区间内。
2.均值和方差:
平均值(期望值):连续均匀分布的平均值计算为(a + b) / 2,其中“a”是下限,“b”是上限。
方差:连续均匀分布的方差计算为 (1/12) * (b — a)²,其中 ‘a’ 是下限,‘b’ 是上限。
举例说明:
例 1:假设我们有一个连续均匀分布,其中“a = 2”和“b = 6”。
范围是[2, 6]。
平均值:(2 + 6)/ 2 = 4
方差:(1/12) * (6-2)² = 1.33
示例 2:考虑“a = 0”和“b = 10”的连续均匀分布。
范围是[0,10]。
平均值: (0 + 10) / 2 = 5
方差:(1/12) * (10-0)² = 8.33
这些示例演示了连续均匀分布的范围、支持度、平均值和方差。
五、与其他分布版的比较
均匀分布与正态分布和其他分布在几个关键方面有所不同:
- 形状:均匀分布在特定间隔内具有恒定的概率密度函数 (PDF),从而呈现矩形或平面形状。相反,正态分布具有钟形曲线,峰值位于平均值处。
- 概率扩散:与正态分布不同,正态分布的概率集中在平均值附近并向尾部减小,而均匀分布为指定范围内的所有结果分配相同的概率。
- 标准差:正态分布的形状由平均值和标准差决定,而均匀分布的分布范围仅由其边界之间的范围定义。
六、结束语
在我们的 ML 系列的第 26 节,我们探索了均匀分布并讨论了它的属性,包括如何计算连续均匀分布的均值和方差。请务必关注第 27 节— 连续概率分布(Gamma 分布),我们将在其中深入研究另一种称为Gamma 分布的连续分布。