当前位置: 首页 > article >正文

【机器学习】基础知识:SSR-残差平方和(Sum of Squared Residuals)

1. 概念

残差平方和(SSR,Sum of Squared Residuals)是统计学和回归分析中的一个指标,用于评估模型拟合数据的效果。
它表示数据点与模型预测值之间的差异(即残差)的平方和,公式为:

SSR = \sum_{i=1}^n (y_i - \hat{y}_i)^2

  • y_i:实际值
  • \hat{y}_i​:模型预测值
  • n:样本数量

2. 残差平方和的意义
  1. 衡量拟合质量:SSR 越小,说明模型预测值与实际值越接近,拟合效果越好。
  2. 模型优化目标:许多回归模型(如最小二乘法)通过最小化 SSR 来确定模型参数。

3. 相关指标
  • 总平方和(SST, Total Sum of Squares)

    SST = \sum_{i=1}^n (y_i - \bar{y})^2

    反映数据点与平均值之间的总变异。

  • 回归平方和(SSR, Sum of Squares for Regression)

    SSR = \sum_{i=1}^n (\hat{y}_i - \bar{y})^2

    反映模型解释的变异。

三者关系为:

SST = SSR + SSE

  • SST:总平方和
  • SSR:回归平方和
  • SSE:残差平方和

4. Python 示例

计算残差平方和(SSR)的代码:

import numpy as np
from sklearn.linear_model import LinearRegression

# 示例数据
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([1.1, 1.9, 3.0, 4.2, 5.1])  # 实际值

# 构建线性回归模型
model = LinearRegression()
model.fit(X, y)
y_pred = model.predict(X)  # 模型预测值

# 计算残差平方和(SSR)
SSR = np.sum((y - y_pred)**2)

print(f"残差平方和(SSR):{SSR:.4f}")

输出示例:

残差平方和(SSR):0.0430

5. 应用场景
  • 线性回归:用来评估模型的拟合程度。
  • 模型选择:通过比较不同模型的 SSR,选择拟合效果更好的模型。
  • 误差分析:分析残差分布,判断模型是否存在系统误差或其他问题。

6. 总结

残差平方和是衡量回归模型误差的核心指标之一,反映了预测值和实际值之间的差异。它在模型优化和评估中有广泛应用,是数据科学和统计建模的重要工具。


http://www.kler.cn/a/429762.html

相关文章:

  • vue的KeepAlive应用(针对全部页面及单一页面进行缓存)
  • 快速上手 INFINI Console 的 TopN 指标功能
  • ZYNQ初识10(zynq_7010)UART通信实验
  • 量子计算:从薛定谔的猫到你的生活
  • PL/SQL语言的文件操作
  • 播放音频文件同步音频文本
  • 能源变革,分布式光伏与储能协调控制
  • socket UDP 环路回显的服务端
  • OPC UA 客户端开发工具,模拟器,可视化GUI
  • HarmonyOS-高级(一)
  • 使用 `typing_extensions.TypeAlias` 简化类型定义:初学者指南
  • 入门网络安全工程师要学习哪些内容【2025年寒假最新学习计划】
  • 在2023idea中如何创建SpringBoot
  • 嵌入式蓝桥杯学习6 定时中断按键(短按 长按 双击)
  • Spring Boot前沿技术集成:驱动招聘信息管理系统高效运转
  • Rust之抽空学习系列(一)—— Hello World
  • Java的Mvc整合Swagger的knife4框架
  • 12.09 C++作业2
  • 【Java计算机毕业设计】Springboot+vue动物保护协会管理系统【源代码+数据库+LW文档+开题报告+答辩稿+部署教程+代码讲解】
  • 如何设置合理的爬取频率避免被网站封锁?
  • 【Python】【Conda 】Conda vs venv:Python开发者的虚拟环境选择指南
  • http 和 https 的区别?
  • 怎么看待逆周期,如何理解超常规,如何调节?
  • leetcode每日一题51
  • 常见面试题之设计模式
  • 《三角洲行动》游戏安全组件运行时发生异常1-0-0,是什么原因?以及要如何解决?