当前位置：首页 > article >正文

【深度学习】通俗理解偏差(Bias)与方差(Variance)

article 2025/4/2 11:05:59

在统计学习中，我们通常使用方差与偏差来衡量一个模型

1. 方差与偏差的概念

偏差(Bais)： 预测值和真实值之间的误差
方差(Variance)： 预测值之间的离散程度

低偏差低方差、高偏差低方差：

图中每个点表示同一个模型每次采样出不同样本训练出来的结果，我们期望的是低偏差低方差
在这里插入图片描述

低偏差高方差、高偏差高方差：
在这里插入图片描述

2. 模型泛化误差

假设我们有样本数据 $D=\{(x_1,y_1),...,(x_n,y_n)\}$ ，其中真实值 $\epsilon$
在使用模型算法评价时，通常使用预测值 $\hat y$ 和真实值 $y$ 的距离，最常用的函数就是距离的平方，均方误差如下公式：
在这里插入图片描述

在这里插入图片描述

如下图所示（横轴表示模型复杂度，纵轴表示误差）我们希望在中间位置找到一个合适的模型复杂度，使得泛化误差尽可能的小。模型过于简单会导致欠拟合，模型过于复杂会导致过拟合。

$泛化误差 = 偏差^2 + 方差 + 数据噪声$

如果模型选择过于简单，会有很多特征学习不到，此时预测值与真实的误差就会很大，即偏差很大
随着模型的复杂度提升，模型学到特征也会越多，此时偏差会逐渐降低
当模型变得更复杂，模型此时可能会学习到一些数据噪声，此时方差变大

在这里插入图片描述

3. 降低方差、偏差、数据噪音

减少偏差：

使用较为复杂模型
集成学习算法 Boosting、Stacking

减少方差：

使用一个较为简单的模型
使用L1、L2等正则化技术
集成学习算法 Bagging、Stacking

减少数据噪音：

来自于数据采集误差，需要更精确的数据采集

本文参考：

https://blog.csdn.net/weixin_42327752/article/details/121428875

查看全文

http://www.kler.cn/a/502534.html

野指针bug

代码随想录day24 | leetcode 491.递增子序列 46.全排列 47.全排列 II

【信息系统项目管理师】高分论文：论信息系统项目的采购管理（社会保险管理核心系统）

第37周：咖啡豆识别 (Tensorflow实战第七周)

STL之VectorMapList针对erase方法踩坑笔记

iOS - Method Swizzling

省市区三级联动（后端）

Java内存与缓存

Qt的.pro文件中宏的作用

英伟达在CES 2025上的技术发布与采访综述

【Qt笔记】QTextEdit和QPlainTextEdit 控件详解

Android车机DIY开发之软件篇(八)单独编译

【机器视觉】OpenCV 图像轮廓（查找/绘制轮廓、轮廓面积/周长、多边形逼近与凸包、外接矩形）

2. Scala 高阶语法之集合与元组

网络原理（三）—— 传输层之 UDP 和 TCP协议

win10 Outlook(new) 企业邮箱登录登录失败。请在几分钟后重试。

Rust调用Windows API制作进程挂起工具

python bs4 selenium 查找a href=javascript:()；的实际点击事件和url

后端:Spring(IOC、AOP)

DHCP详解和部署

1. 方差与偏差的概念

2. 模型泛化误差

3. 降低方差、偏差、数据噪音

相关文章：