当前位置: 首页 > article >正文

机器学习评价标准

机器学习作为算子引入工程,必然要有方法评价模型的有效性,通常从两个方面进行考虑:

  • 从所用技术出发,看模型在所用技术下的性能,比如对于分类问题,不同分类模型采用交叉熵进行横向比较。
  • 从泛化性出发,看模型面对未知新数据是否能表现良好,也就是是否发生欠拟合&过拟合。
  • 从数据/业务逻辑出发,特别是样本不均衡问题,通常难以用某个单一指标进行比较,举例:在银行客户欺诈行为的检测系统中,存在欺诈行为的客户可能不到万分之一。那么,一个模型只要预测所有的客户都没有欺诈行为,这个模型的准确率就能达 99.999%,仅通过单一的准确率指标进行横向比较显然对其他模型不公平,该例可以采用f1score,AUC进行比较

 


http://www.kler.cn/a/401226.html

相关文章:

  • 【Vue笔记】基于vue3 + element-plus + el-dialog封装一个自定义的dialog弹出窗口组件
  • 用Ruby编写一个自动化测试脚本,验证网站登录功能的正确性。
  • 区块链中的wasm合约是什么?
  • 【python】Bokeh 与 Plotly:创建交互式数据可视化工具
  • 3D Streaming 在线互动展示系统:NVIDIA RTX 4090 加速实时渲染行业数字化转型
  • 汽车与摩托车分类数据集
  • Postman之newman
  • 使用Python和OpenCV连接并处理IP摄像头视频流
  • 点云(网格)PCA及其存在的问题
  • 「三」体验HarmonyOS端云一体化开发模板——使用DevEco Studio直接创建端云一体化工程
  • 计算机视觉:赋予机器“看”的能力
  • element表单校验
  • 高级java每日一道面试题-2024年11月12日-框架篇[SpringBoot篇]-SpringBoot中的监视器是什么?
  • 【mongo8社区办】mongosh MongoServerSelectionError 超时
  • uniapp实现中英文切换
  • 15分钟学 Go 第 59 天 :更高级的Go话题——接触微服务
  • 力扣题目总结
  • 解析 Apache SeaTunnel 的任务运行过程
  • 第7章硬件测试-7.4 专业实验
  • 内容分发网络CDN、动态内容缓存简介
  • Vite 基础理解及应用
  • ThreadLocal 和 Caffeine 缓存是两种不同的缓存机制,它们在用途和实现上有明显的区别
  • hash表和B树
  • 《人工智能深度学习的基本路线图》
  • DevOps-Jenkins-新手入门级
  • IndentationError: unindent does not match any outer indentation level