当前位置: 首页 > article >正文

2.0 机器学习任务攻略

1 Framework of ML

在这里插入图片描述

2 General Guide – How to improve your model performance


在这里插入图片描述

2.1 training loss large: Model Bias

在这里插入图片描述

2.2 training loss small: Optimization

在这里插入图片描述

which one?: Model Bias v.s. Optimization Issue

在这里插入图片描述
可以看出,在训练集上, 56层network的training error甚至比20层network的还大,则说明56层network的optimization没有调好

那怎么确定是否是optimization的问题呢?

可以先用一些简单的模型,试试训练集上的error,再和复杂模型的training error对比


在这里插入图片描述

2.3 training loss small; testing loss large: overfitting

在这里插入图片描述
如何解决overfitting呢?

  • more training data (not suggested)
  • Data Augmentation
  • constrain your model to be less complex

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2.4 training loss small; testing loss large: mismatch

是否判断出现mismatch:需要我们对训练数据、测试数据有一定的了解,它们是如何产生的?

在这里插入图片描述

3 Bias - Complexity Trade-off

在这里插入图片描述

4 how to pick the right model

在这里插入图片描述

在这里插入图片描述

4.1 用Cross Validation选model

通过validation set的error挑选model

4.2 N-fold Cross Validation

在这里插入图片描述


http://www.kler.cn/a/503734.html

相关文章:

  • Vue 3前端与Python(Django)后端接口简单示例
  • ESP32,uart安装驱动uart_driver_install函数剖析,以及intr_alloc_flags 参数的意义
  • 3D目标检测数据集——Nusence数据集
  • String.intern是什么
  • 【某大型互联网企业】软件测试面试经验分享(1 ~ 3年)
  • linux自动分区后devmappercentos-home删除后合并到其它分区上
  • JAVA之单例模式
  • 【2024年华为OD机试】 (B卷,100分)- 矩形相交的面积(Java JS PythonC/C++)
  • 【MacOS】恢复打开系统设置的安全性的允许以下来源的应用程序的“任何来源”
  • 掌控 JMeter 测试节奏:Once Only Controller 让关键操作 “一步到位”
  • FPGA EDA软件的位流验证
  • 【深度学习】神经网络灾难性遗忘(Catastrophic Forgetting,CF)问题
  • 深入理解ASP.NET Core 管道的工作原理
  • Next.js如何用静态文件部署
  • 高并发性能优化随笔
  • 大疆上云API基于源码部署
  • 互联网全景消息(11)之Kafka深度剖析(下)
  • 为AI聊天工具添加一个知识系统 之38 一个基于ad hoc 临时传输实现的组织的动态社区平台
  • firefox PAC代理
  • 进阶——十六届蓝桥杯嵌入式熟练度练习(LCD显示屏)
  • 【2025最新】100%通过的计算机毕设新题目
  • Web 开发入门之旅:从静态页面到全栈应用的第一步
  • Golang概述
  • DeepSeek-V3技术报告
  • JavaSE面试
  • 搜广推校招面经七