当前位置: 首页 > article >正文

Datawhale X 李宏毅苹果书 AI夏令营_深度学习基础学习心得Task2.2

本次学习分类问题

1、分类与回归:

回归一般输出一个值y_hat 期望与y越接近越好。分类一般有几类就输出几个值,是一个one-hot的向量,在类别对应的位置值为1

本文介绍了一种重复输出数值后加权的方法,但是我做分类一般用全连接层直接输出多个值,然后使用argmax函数

2、softmax:

公式:

其实主要是一个归一化的作用,并且输出所有值的和为1,这样就类似于每一个类别的概率;并且它还会让大的值和小的值差距更大

但是在二分类问题中,sigmoid和softmax是等价的,一般取sigmoid

3、损失函数:

第一种是均方误差MSE但是这个我一般在回归任务用

第二种是交叉熵CE这个我觉得是最经典的

为什么选CE:

在刚开始训练的时候,CE是有梯度可以下降的,而MSE没有,容易卡住

###################################

心得:我的课题主要是围绕着分类,回归的,所以这一节内容比较熟,就当巩固一遍了


http://www.kler.cn/a/282994.html

相关文章:

  • 利用编程语言和脚本编写技术,实现自动化渗透测试和安全工具的开发
  • apache2配置多站点
  • Axure设计之文本编辑器制作教程
  • 提取神经网络数学表达式
  • 前端垂直居中的多种实现方式及应用分析
  • sql server 查看io资源使用
  • Java 入门指南:Java NIO —— Selector(选择器)
  • 【hot100篇-python刷题记录】【搜索二维矩阵】
  • 分布式锁的实现:ZooKeeper 的解决方案
  • hive数据迁移
  • 低代码革命:JNPF平台如何简化企业应用开发
  • Linux 中的中断响应机制
  • TCP keepalive和HTTP keepalive区别
  • SCP拷贝失败解决办法
  • 基于单片机的指纹识别考勤系统设计
  • Web应用服务器Tomcat
  • 基于STM32开发的智能家居温度控制系统
  • Linux下的使用字符设备驱动框架编写ADC驱动 ——MQ-4传感器
  • 我在高职教STM32——ADC电压采集与光敏电阻(2)
  • rnn-手动实现
  • 区块链入门
  • Element Plus上传图片前,对图片进行压缩
  • 基于asp.net的webform图书管理系统附源码
  • django 中 csrf 的实现机制
  • CVE-2024-26229 漏洞复现分析
  • 详解PASCAL VOC数据集及基于Python和PyTorch的下载、解析及可视化【目标检测+类别分割】