当前位置: 首页 > article >正文

什么是集成学习

什么是集成学习

  • 集成学习是一种分布式机器学习框架,通过构建多个学习器并将其结合起来完成学习任务。由于在实际应用中单一的学习器往往不能达到理想的学习效果,且有时单一学习器会导致过拟合,因此使用多个学习器进行集成学习往往能够达到更好的学习效果。

  • 根据学习器训练的模型是否为同类模型,集成学习分为同质集成学习和异质集成学习两类。

    1. 若训练的多个模型是同一类型的模型,则为同质集成学习,所用算法称为“基学习算法”,每一个模型称为“基学习器”。
    2. 若训练的多个模型非同一类型的模型,则为异质集成学习,每一个模型称为“组件学习器”或“个体学习器”。
  • 根据模型训练和结合策略的不同,集成学习可分为串行方法(Boosting)、并行方法(Bagging)和堆叠方法(Stacking)三类。image-20230725220053843

  • 根据任务类型是分类还是回归,集成学习的融合方式可以分为投票(voting),平均(averaging)

    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • sklearn中的集成算法模块ensemble

    类的功能
    ensemble.AdaBoostClassifierAdaBoost分类
    ensemble.AdaBoostRegressorAdaBoost回归
    ensemble.BaggingClassifier袋装分类器
    ensemble.BaggingRegressor袋装回归器
    ensemble.ExtraTreesClassifierExtra-trees分类(超树,极端随机树)
    ensemble.ExtraTreesRegressorExtra-trees回归
    ensemble.GradientBoostingClassifier梯度提升分类
    ensemble.GradientBoostingRegressor梯度提升回归
    ensemble.IsolationForest孤立森林
    ensemble.RandomForestClassifier随机森林分类
    ensemble.RandomForestRegressor随机森林回归
    ensemble.RandomTreesEmbedding完全随机树的集成
    ensemble.VotingClassifier用于不合适估算器的软投票/多数规则分类器

    集成算法中,有一半以上都是树的集成模型,可以想见决策树在集成中必定是有很好的效果。



http://www.kler.cn/a/527731.html

相关文章:

  • 需求分析应该从哪些方面来着手做?
  • deepseek核心技术:MLA架构-多头潜在注意力
  • Autogen_core源码:_agent_runtime.py
  • 【电工基础】低压电器元件,低压断路器(空开QF),接触器(KM)
  • Day29(补)-【AI思考】-精准突围策略——从“时间贫困“到“效率自由“的逆袭方案
  • FAST-DDS and ROS2 RQT connect
  • TypeScript 学习 -代码检查工具 eslint
  • Day31-【AI思考】-关键支点识别与战略聚焦框架
  • FFmpeg(7.1版本)的基本组成
  • 【C++语言】卡码网语言基础课系列----1. A+B问题I
  • 2025年人工智能技术:Prompt与Agent的发展趋势与机遇
  • 从训练到生产:AI 模型如何突破困境实现高效部署?
  • DeepSeek本地版安装简易教程(windows)
  • 第24节课:前端性能优化—提升网页加载速度的关键策略
  • 计算机网络一点事(22)
  • RK3568使用MIX415摄像头
  • 笔试-二进制
  • 实验四 简单查询
  • 【2024年华为OD机试】(C卷,100分)- 检查是否存在满足条件的数字组合 (Java JS PythonC/C++)
  • Redis_Redission的入门案例、多主案例搭建、分布式锁进行加锁、解锁底层源码解析
  • Ruby 类和对象
  • 专业绘图软件draw.io安装使用
  • 2021 年 12 月大学英语四级考试真题(第 3 套)——纯享题目版
  • Jason配置环境变量
  • Docker小游戏 | 使用Docker部署2048网页小游戏
  • 自制虚拟机(C/C++)(一、分析语法和easyx运用,完整虚拟机实现)