当前位置: 首页 > article >正文

【机器学习】9. softmax(Multinomial Logistic Regression)

softmax(Multinomial Logistic Regression)

如果把样本类别,看作是一种随机事件的话,那么它需要满足两种条件:

  • 每个类别的概率和为1
  • 每个类别的概率在【0,1】

p ( C k ∣ x ) = e w k T x ∑ k ′ e w k ′ T x p(C_k | x) = \frac{e^{w_k^T}x}{\sum_{k'} e^{w_{k'}^Tx}} p(Ckx)=kewkTxewkTx
或者写成:
s o f t m a x ( x n ) = e x n ∑ i = 1 N e x i softmax (x_n) = \frac{e^{x_n}}{\sum^N_{i=1}e^{x_i}} softmax(xn)=i=1Nexiexn

e x n e^{x_n} exn 表示当前标量
∑ i = 1 N e x i \sum^N_{i=1}e^{x_i} i=1Nexi 表示待映射标量的指数和

bilibili:编程八点档

截图来源: 哔哩哔哩:编程八点档

决策边界:
a r g m a x k P ( C k ∣ x ) arg max_kP(C_k|x) argmaxkP(Ckx)
a r g m a x k w k T x arg max_kw_k^Tx argmaxkwkTx

one-hot 编码

为了保证类别之间相互独立,转换成one-hot编码。

交叉熵误差函数

单个样本的损失:

l = − ∑ I = 1 N y i ∗ l o g 2 y ^ l = -\sum^N_{I=1}y_i*log_2\hat y l=I=1Nyilog2y^

yi 真实概率

多个样本

l = − 1 T ∑ j = 1 T ( ∑ i = 1 N y i ( j ) ∗ l o g y ^ i ( j ) ) l = -\frac{1}{T}\sum^T_{j=1}(\sum^N_{i=1}y_i^{(j)}*log\hat y_i^{(j)}) l=T1j=1T(i=1Nyi(j)logy^i(j))

T: 样本个数
j:第j个样本
i:第i个标签
l = − 1 T ∑ j = 1 T ( ∑ i = 1 N y i ( j ) ∗ l o g e x n ∑ i = 1 N e x i ) l = -\frac{1}{T}\sum^T_{j=1}(\sum^N_{i=1}y_i^{(j)}*log \frac{e^{x_n}}{\sum^N_{i=1}e^{x_i}}) l=T1j=1T(i=1Nyi(j)logi=1Nexiexn)


http://www.kler.cn/a/284385.html

相关文章:

  • Vue3.js - 一文看懂Vuex
  • Windows C++ TCP/IP 两台电脑上互相传输字符串数据
  • 山泽光纤HDMI线:铜线的隐藏力量
  • Vue 的生命周期函数 和 Vuex
  • Python 连接 Redis 进行增删改查(CRUD)操作
  • NAT网络工作原理和NAT类型
  • SQL数据库教案(入门必备)
  • 【C++ 第十六章】哈希
  • C# 弹出USB移动存储设备【附源码】
  • 假如我是前端面试官
  • 解决移动端使用Vant van-overlay 遮罩层导致的弹窗不可滚动问题
  • Linux 非root用户部署elasticsearch 7.17.23和ik分词器
  • cnocr 安装
  • 华为云征文|Flexus云服务器搭建基础环境
  • 聚合函数的艺术:SQL中的SUM、AVG、MAX、MIN深度解析
  • JavaScript在网页设计
  • LuaJit分析(六)luajit -bl 命令分析
  • OpenCV几何图像变换(11)极坐标转换函数warpPolar()的使用
  • 微服务事务管理
  • 计网_整体概念逻辑简单过一遍
  • 谷粒商城实战笔记-265~268-商城业务-订单服务-订单确认页模型抽取和数据填充-Feign丢失数据问题
  • ws2812b效果研究之一 cylon
  • linux------数据结构
  • Scriban:高效、强大的.NET开源模板引擎,可用于邮件、文档生成!
  • 数据结构—栈和队列
  • git 更改分支名称