当前位置: 首页 > article >正文

知识蒸馏相关基础知识

知识蒸馏

前置知识

  1. Loss
    在这里插入图片描述
    现在分数-正确分数+1
    例:
    在这里插入图片描述

  2. 正则化 Regularization
    用来防止过拟合
    在这里插入图片描述
    在这里插入图片描述

知识蒸馏相关

  1. softmax
    把分数转换为概率的一种方法,e的次方
    在这里插入图片描述

  2. hard targets 和 soft targets

在这里插入图片描述

  1. 蒸馏温度 T
    在原来的softmax下,除以某个系数,让概率值相差不太大
    在这里插入图片描述

  2. 知识蒸馏过程
    在这里插入图片描述

在这里插入图片描述
Loss:
hard loss: 传统交叉熵
distillation loss:
9在这里插入图片描述
一般需要训练好的情趣额度较高的大的教师模型,和未训练的小的学生模型进行训练


http://www.kler.cn/a/150165.html

相关文章:

  • Visual Studio | 配置管理
  • 平衡者:陈欣的宇宙使命
  • 【力扣 + 牛客 | SQL题 | 每日5题】牛客SQL热题216,217,223
  • 适用于 c++ 的 wxWidgets框架源码编译SDK-windows篇
  • utf-8、pbkdf2_sha
  • 2024年一带一路金砖技能大赛之大数据容器云开发
  • Vue3框架中让table合计居中对齐
  • 自定义类型:结构体,枚举,联合
  • A*算法学习
  • 论文笔记:Confidential Assets
  • Python与设计模式--命令模式
  • Spark将execl表格文件导入到mysql中
  • 亚马逊云科技基于 Polygon 推出首款 Amazon Managed Blockchain Access,助 Web3 开发人员降低区块链节点运行成本
  • springboot(ssm文学名著分享系统 文化交流平台Java(codeLW)
  • 【brew】Mac上安装vue3
  • 【数据挖掘】国科大刘莹老师数据挖掘课程作业 —— 第二次作业
  • Linux的基本指令(3)
  • 初识Dockerfile
  • 3dMax导出glft和glb格式模型插件Max2Babylon教程
  • 针对net core 使用CSRedis 操作redis的三种连接实例方式
  • Typescript中 interface 和 type 的区别是什么?
  • 后端Java日常实习生面试(七牛云2023年11月14日)
  • php通过curl方式发送接受xml数据
  • HarmonyOS入门开发(三) 持久化存储Preferences
  • day65 django回顾3
  • WordPress 粘贴图片上传插件