当前位置: 首页 > article >正文

DataWhale X 南瓜书学习笔记 task03笔记

对数几率回归

  • 使用场景:分类任务。
  • 根据广义线性模型,分类任务构建模型的基本思想:找到一个单调可微函数将分类任务的真实标记(值)与线性回归模型的预测值联系起来。

    对数几率回归的引入

二分类任务

  • 输出标记:y\in{0,1}
  • 线性模型产生的预测值(实数值)=>二分类任务的输出标记,我们需要单位阶跃函数
  • 单位阶跃函数如下:

 从图3.2可看出,单位阶跃函数不连续,而广义线性模型中的g(.)是连续函数,如果要构建线性模型,单位阶跃函数肯定是不行的,但是我们又特别需要单位阶跃函数的特性,故而找到了对数几率函数。


对数几率函数的正篇

  • 对数几率函数的原始形式:
  • 对数几率函数的特性:
  1. 将z值=>接近0/1的y值
  2. y值在z=0附近变化很陡
  3. 任意阶可导的凸函数
  • 对数几率函数作为g(.)代入广义线性函数:

  • (3.18 )式变成严格的线性函数形式:

我们可视为样本x作为正例的可能性,则1-y是其反例可能性,2者的比值:

(3.20)式称为”几率“,再取对就是(3.19)的左式。

确定(3.18)中的w和b:

 若将式(3.18)中的y视为类后验概率估计p(y = 1| x),则式(3.19)可重写为:

通过”极大似然法“估计w和b: 

在对率回归模型最大化“对数似然”如下:

由(3.25)式,我们可知令每个样本属于其真实标记的概率越大越好。

为了便于讨论,令\beta=(w:b),

  • 对数几率函数的优点:
  1. 直接对分类可能性进行建模,无需事先假设数据分布。
  2. 不仅是预测出”类别“,而且是得到近似概率预测,对利用概率辅助决策的任务很有用。


http://www.kler.cn/a/318161.html

相关文章:

  • 在MySQL 主库上进行自动清理 purged gtid 时,会等待 binlog复制到从库吗
  • 【联动】【MSS】【AF】
  • 观察者模式和发布-订阅模式有什么异同?它们在哪些情况下会被使用?
  • 007-spring-bean的相关配置(重要)
  • RabbitMQ中的Topic模式
  • 【知识】cuda检测GPU是否支持P2P通信及一些注意事项
  • vue3+Element-plus el-input 输入框组件二次封装(支持金额、整数、电话、小数、身份证、小数点位数控制,金额显示中文提示等功能)
  • rust属性宏
  • HTML段落,换行,水平线标签与其属性
  • c/c++八股文
  • MySQL 生产环境性能优化
  • 使用分布式调度框架时需要考虑的问题——详解
  • python 实现 P-Series algorithm算法
  • Seamless:Facebook推出的跨语言语音识别/翻译/合成大模型
  • 计算总体方差statistics.pvariance()
  • 通信工程学习:什么是VNF虚拟网络功能
  • 海思Hi3559av100 sdk开发环境搭建
  • 面试金典题2.3
  • 引用和指针的区别
  • canvas绘制线段、矩形、圆形、文字、贝塞尔曲线、图像、视频处理、线性渐变、径向渐变、坐标变化,旋转,缩放,图形移动
  • 使用数据基础描述进行连续变量的特征提取
  • MySQL数据库索引、事务和存储引擎管理
  • Java基础知识扫盲
  • 代码随想录Day 53|题目:110. 字符串接龙、105.有向图的完全可达性、106. 岛屿的周长
  • Taro多端统一开发解决方案
  • 深入理解LLM的可观测性