当前位置: 首页 > article >正文

交叉验证、精确率、召回率

1. 交叉验证

        交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。

那么什么时候才需要交叉验证呢?

        交叉验证用在数据不是很充足的时候。如果数据样本量小于一万条,我们就会采用交叉验证来训练优化选择模型。如果样本大于一万条的话,我们一般随机的把数据分成三份,一份为训练集,一份为验证集,最后一份为测试集。

        用训练集来训练模型,用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终得到的模型再用于测试集,最终决定使用哪个模型以及对应参数。

2. 精确率、召回率

        在机器学习的算法评估中,尤其是分类算法评估中,我们经常听到精确率(precision)与召回率(recall),RoC曲线与PR曲线这些概念。

  1. True Positives,TP:预测为正样本,实际也为正样本的特征数

  2. False Positives,FP:预测为正样本,实际为负样本的特征数

  3. True Negatives,TN:预测为负样本,实际也为负样本的特征数

  4. False Negatives,FN:预测为负样本,实际为正样本的特征数

使用RoC曲线和PR曲线,我们就能很方便的评估我们的模型的分类能力的优劣了。


http://www.kler.cn/a/532205.html

相关文章:

  • 蓝桥备赛指南(6)
  • html中的表格属性以及合并操作
  • 【爬虫】JS逆向解决某药的商品价格加密
  • 2025年1月个人工作生活总结
  • 【二分题目】
  • C++——模版
  • 【阅读笔记】LED显示屏非均匀度校正
  • Vue.js 使用组件库构建 UI
  • 北京怀柔区区划地图矢量cdr格式ai高清大图
  • 一次线程数超限导致的hive写入hbase作业失败分析
  • 2.8学习记录
  • 什么是物理地址,什么是虚拟地址?
  • H. The Third Letter
  • 接入DeepSeek大模型
  • 蓝桥杯思维训练营(三)
  • 【Leetcode刷题记录】2090. 半径为 k 的子数组平均值--定长滑动窗口解法和前缀和解法
  • 基于RK3588+算能BM1684X的云电脑/云手机系统设计与实现
  • 【Go语言圣经】第七节:接口
  • 蓝桥杯接龙序列
  • 83-《南茼蒿》
  • python列表知道下标怎么取值
  • 输出解析器的使用
  • 介绍一下Mybatis的底层原理(包括一二级缓存)
  • 基于“蘑菇书”的强化学习知识点(四):贝尔曼方程
  • deepseek的对话风格
  • 单链表的“影分身术”:随机指针链表的深度拷贝实现