当前位置：首页 > article >正文

讲清逻辑回归算法，剖析其作为广义线性模型的原因

article 2025/2/4 11:30:33

1、逻辑回归算法介绍

逻辑回归(Logistic Regression)是一种广义线性回归分析模型。虽然名字里带有“回归”两字，但其实是分类模型，常用于二分类。既然逻辑回归模型是分类模型，为什么名字里会含有“回归”二字呢？这是因为其算法原理同样涉及线性回归模型中的线性回归方程。线性回归方程是用于预测连续变量的，其y的取值范围为（−∞，＋∞），而逻辑回归模型是用于预测类别的，例如，用逻辑回归模型预测一个人是否会违约、客户是否会流失，在本质上预测的是一个人是否违约、是否流失的概率，而概率的取值范围是0～1，因此不能直接用线性回归方程来预测概率。

☀什么是连续型变量？

连续型变量是指在一定范围内可以取无限多个可能值的数据类型。这些值通常可以是任意小数，且在理论上没有间隔。例如，时间、温度、长度、重量等都是典型的连续型数据，因为它们可以在某个区间内无限细分。

关键特点：

①无限可分：在任意两个值之间，存在无数个中间值。

②小数可能性：可以精确到小数点后多位（如身高1.75米、温度36.8°C）。

③测量精度：实际应用中可能受限于测量工具，但理论上连续。

连续型与离散型数值的对比
特征	连续型数值	离散型数值
取值范围	无限细分（如0.1, 0.01, ...）	有限且可数（如1, 2, 3）
例子	温度、时间、价格、身高	人数、商品数量、考试题数
统计方法	线性回归、相关分析	计数模型（泊松回归）、卡方检验

那么，想将线性回归应用到分类问题中该怎么办呢？也就是如何把一个取值范围是（−∞，＋∞）的回归方程变为取值范围是（0，1）的内容呢？

假设y＝3，通过Sigmoid函数转换后，f(y)＝1/(1+e^−3)＝0.95，就可以作为一个概率值使用了。

Sigmoid函数的曲线如下图所示，从图上可知，当y值趋向负无穷(−∞)时，f(y)的值趋向于0；当y值趋向正无穷(＋∞)时，f(y)的值趋向于1，且函数的值域为(0，1)。这样，就将线性回归中

得到的取值范围为（−∞，＋∞）的值，变成了取值范围为（0，1）之间的概率值。

将线性回归函数结果y放到Sigmoid函数中去，就构造了逻辑回归函数，函数表达式为：

逻辑回归模型本质就是将线性回归模型通过Sigmoid函数进行了一个非线性转换，将线性回归的结果(−∞，＋∞)转换到一个介于0～1之间的概率值。逻辑回归带有“回归”却是分类问题就是因为Sigmoid函数，Sigmoid函数将数据压缩到[0, 1]之间，并经过一个重要的点(0, 0.5)。这样，可以将 0.5作为阈值，当值大于0.5作为一类，而小于0.5作为另一类。

2、为什么说逻辑回归是广义的线性模型

（1）公式角度

在Sigmoid函数的两边乘以(1+e^−y)，则等式转换为：