置信度是什么?
置信度是什么?
flyfish
频率学派 → 置信度(Confidence Level) → 100次检测里对90次。
贝叶斯学派(完全不使用“置信度”和“置信区间”的概念) → 后验概率(Posterior) → 这次检测90%可能对。
机器学习 → 置信度(Confidence) → 我觉得这次90%对(接近贝叶斯思想,但不是严格计算)。
频率学派强调通过重复实验来定义概率;贝叶斯学派则关注如何利用现有数据和先前的知识来更新我们的信念;而在机器学习中,置信度常常用于描述模型预测的确定性水平,尽管这不一定严格遵循贝叶斯或频率学派的方法。
一、频率学派 vs 贝叶斯学派
1. 频率学派(Frequentist)的“置信度”
- 定义:置信度(Confidence Level,如95%)是频率学派对参数估计不确定性的描述工具,核心是“重复抽样”思想。
- 置信区间(Confidence Interval):
例如,说“某参数θ的95%置信区间是[1, 5]”,实际含义是:
如果重复抽样无限次,每次构造一个区间,则95%的区间会包含真实θ值。
关键点:- 置信度是对“区间构造方法”的信任程度,而非对“当前区间包含θ”的概率。
- θ在频率学派中是固定未知的常数,不是随机变量,因此不能说“θ有95%概率落在[1,5]”。
- 场景:你买了一个体重秤,想知道它准不准。
- 频率学派做法:
- 你让100个朋友轮流称体重100次,计算每个朋友的平均体重。
- 如果“95%的朋友的平均体重误差在±1kg内”,就说这个秤的“95%置信区间是±1kg”。
- 潜台词:如果未来继续测更多人,95%的情况下结果不会离谱。但不能说“你的体重有95%概率在±1kg内”。
2. 贝叶斯学派(Bayesian)的“可信区间”
- 定义:贝叶斯学派用**可信区间(Credible Interval)**描述不确定性,核心是“主观概率”思想。
- 后验分布(Posterior Distribution):
贝叶斯将参数θ视为随机变量,通过先验分布(Prior)和似然函数(Likelihood)计算后验分布,得到θ的概率分布。 - 可信区间:
例如,“θ的95%可信区间是[1,5]”直接表示:根据当前数据和先验信息,θ有95%概率落在此区间。
关键点:- 贝叶斯允许对参数本身赋予概率解释(如“θ有95%概率在[1,5]”)。
- 不需要“重复抽样”假设,结论直接基于当前数据和先验。
- 场景:你暗恋一个人,想知道TA喜欢你的概率。
- 贝叶斯做法:
- 你先猜一个“先验概率”(比如50%,觉得TA可能对你有好感)。
- 然后观察TA的行为:主动找你聊天(+概率)、拒绝约会(-概率)。
- 综合这些信息,更新得到一个“后验概率”,比如“TA喜欢你的概率是80%”。
- 直接结论:你可以说“TA喜欢你的概率在70%~90%之间”(可信区间)。
- 潜台词:这个区间直接反映了你当前的信心,无需假设无限次重复试探。
3. 贝叶斯学派没有“置信度”概念
- 贝叶斯学派完全不使用“置信度”和“置信区间”,因为:
- 参数θ是随机变量,其不确定性已通过后验分布完整描述。
- 直接用可信区间表达概率意义,无需依赖频率学派的长期频率解释。
- 贝叶斯学派中,不使用置信度(Confidence Level)这一术语,因其在统计学中特指频率学派的置信区间(Confidence Interval)方法论。
- 贝叶斯学派对应概念为可信区间(Credible Interval)或后验概率(Posterior Probability),直接描述参数在给定数据下的概率分布。
4. 机器学习的置信度的本质是“预测确定性”
- 机器学习的中的“置信度(Confidence)”是机器学习领域的工程术语,与统计学中的“置信度”无严格对应关系,属于概率论词汇的借用。
- 其本质是模型对单次检测结果的确定性评分(Certainty Score),更接近主观概率信念(Subjective Probability)。
5. 机器学习的置信度与贝叶斯思维的关联性
尽管机器学习的未显式使用贝叶斯公式,但其设计逻辑隐式符合贝叶斯框架:
- 先验(Prior):通过训练数据学习目标分布(如COCO数据集中“人”这个类别的分布)。
- 似然(Likelihood):预测框与真实框的重叠度(IoU)反映当前检测的匹配程度。
- 确定性评分(Confidence):综合先验和似然得出的主观信念值(如当前框有80%概率正确)。
- 它既不是频率学派的“长期正确率”,也不是贝叶斯的严格后验概率,而是模型对单次检测的主观打分。
- 例如:机器学习的看到一只猫,心想:“根据我见过的几万张猫图,这框有90%可能是对的,我就标个0.9吧!”
6.机器学习置信度是工程实践的概率近似
1. 本质解构
数学形式
- 目标检测通用式:
Confidence = P obj × IoU pred \text{Confidence} = P_{\text{obj}} \times \text{IoU}_{\text{pred}} Confidence=Pobj×IoUpred- P obj P_{\text{obj}} Pobj:目标存在概率(分类分支输出)
- IoU pred \text{IoU}_{\text{pred}} IoUpred:预测框与真实框交并比估计值
工程实现演进
特征维度 | 目标检测版本1 | 目标检测版本2 |
---|---|---|
坐标回归 | 直接预测偏移量(线性输出) | 离散概率分布 → 期望值计算 |
IoU估计 | 基于锚框的启发式计算 | 概率密度积分(精确建模) |
损失函数 | MSE + 交叉熵 | Distribution Focal Loss |
样本匹配 | 固定IoU阈值 | 任务对齐的动态加权策略 |
2. 数学深探
目标检测版本1实例演算
- 输入特征:锚框尺寸(12,18),预测偏移量(0.3, -0.2)
- 坐标计算:
w = 12 e 0.3 ≈ 16.2 , h = 18 e − 0.2 ≈ 14.7 w = 12e^{0.3} \approx 16.2,\ \ h = 18e^{-0.2} \approx 14.7 w=12e0.3≈16.2, h=18e−0.2≈14.7 - 若实测IoU=0.72,置信度=0.9×0.72=0.648
目标检测版本2概率革新
- 位置分布:(p_x = [0.1, 0.3, 0.4, 0.2])
- 期望坐标:
E ( x ) = 0.1 × 1 + 0.3 × 2 + 0.4 × 3 + 0.2 × 4 = 2.9 E(x) = 0.1×1 + 0.3×2 + 0.4×3 + 0.2×4 = 2.9 E(x)=0.1×1+0.3×2+0.4×3+0.2×4=2.9 - 通过概率密度积分得IoU=0.81,置信度=0.85×0.81≈0.688