当前位置: 首页 > article >正文

OpenCV机器学习(8)随机森林(Random Forests)算法cv::ml::RTrees类

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

cv::ml::RTrees 是 OpenCV 机器学习模块中的一部分,用于实现随机森林(Random Forests)算法。随机森林是一种集成学习方法,它通过构建多个决策树并将它们的结果进行汇总来提高预测准确性和控制过拟合。

主要特点

  • 分类与回归:既可以用于分类任务也可以用于回归任务。
  • 高准确性:由于其集成的特性,通常能够提供比单个决策树更高的预测准确性。
  • 抗过拟合能力强:通过随机选择特征和样本,随机森林能有效减少过拟合的风险。
  • 易于使用:相对简单易用,且不需要太多的参数调整即可获得良好的性能。

常用成员函数

以下是一些常用的 cv::ml::RTrees 类成员函数:

  • 创建模型实例
    • Ptr create():创建一个新的 RTrees 模型实例。
  • 设置模型参数
    • setTermCriteria(TermCriteria val):设置终止条件(例如最大迭代次数或最小误差变化量)。
    • setMaxDepth(int val):设置每棵树的最大深度。
    • setMinSampleCount(int val):设置分裂节点所需的最小样本数。
    • setRegressionAccuracy(float val):设置回归模式下的精度要求。
    • setUseSurrogates(bool val):设置是否使用代理分裂规则处理缺失值。
    • setPriors(Mat val):设置先验概率。
    • setCalculateVarImportance(bool val):设置是否计算变量重要性。
    • setActiveVarCount(int val):设置每棵树在每个节点上考虑的特征数量。

训练模型

  • train(const Ptr& trainData, int flags=0):使用提供的训练数据进行训练。
  • train(InputArray samples, int layout, InputArray responses):另一种形式的训练函数,直接接受样本和响应矩阵作为输入。

预测

  • predict(InputArray samples, OutputArray results=noArray(), int flags=0) const:对新样本进行预测,并返回每个样本的类别标签或预测值(取决于标志)。

保存与加载模型

  • save(const String& filename):将模型保存到文件。
  • load(const String& filename):从文件加载模型。

代码示例

#include <iostream>
#include <opencv2/ml.hpp>
#include <opencv2/opencv.hpp>

using namespace cv;
using namespace cv::ml;
using namespace std;

int main()
{
    // 准备训练数据
    Mat samples = ( Mat_< float >( 4, 2 ) << 0.5, 1.0, 1.0, 1.5, 2.0, 0.5, 1.5, 0.0 );

    Mat responses = ( Mat_< int >( 4, 1 ) << 0, 0, 1, 1 );

    // 确保数据和标签是正确的类型
    if ( samples.type() != CV_32F )
    {
        samples.convertTo( samples, CV_32F );
    }
    if ( responses.type() != CV_32S )
    {  // 对于分类任务,标签通常是整数类型
        responses.convertTo( responses, CV_32S );
    }

    // 创建并配置 RTrees 模型
    Ptr< RTrees > rf_model = RTrees::create();
    rf_model->setMaxDepth( 10 );       // 设置每棵树的最大深度
    rf_model->setMinSampleCount( 2 );  // 设置分裂节点所需的最小样本数
    TermCriteria criteria( TermCriteria::MAX_ITER + TermCriteria::EPS, 100, 0.01 );
    rf_model->setTermCriteria( criteria );  // 设置终止条件

    // 使用TrainData创建训练数据对象
    Ptr< TrainData > trainData = TrainData::create( samples, ROW_SAMPLE, responses );

    // 训练模型
    bool ok = rf_model->train( trainData );
    if ( ok )
    {
        // 保存模型
        rf_model->save( "rf_model.yml" );

        // 对新样本进行预测
        Mat sample     = ( Mat_< float >( 1, 2 ) << 1.6, 0.7 );
        float response = rf_model->predict( sample );

        cout << "The predicted response for the sample is: " << response << endl;
    }
    else
    {
        cerr << "Training failed!" << endl;
    }

    return 0;
}

运行结果

The predicted response for the sample is: 1

http://www.kler.cn/a/556054.html

相关文章:

  • 【Java学习】多态
  • UE地编材质世界对齐纹理旋转
  • 用JMeter给要登录的操作做压力测试
  • 23种设计模式 - 原型模式
  • Pytorch实现之特征损失与残差结构稳定GAN训练,并训练自己的数据集
  • 【HarmonyOS Next】鸿蒙监听手机按键
  • React 高阶组件的优缺点
  • 阿里云ACK+GitLab企业级部署实战教程
  • 大型工业设备翻新集团企业数字化转型SAP解决方案总结
  • NetLogon 权限提升漏洞
  • Angular 中获取 DOM 节点的几种方法
  • C++ Primer string流
  • SpringBoot项目实现用户token和资源的多重校验
  • 【原创】vue-element-admin-plus完成编辑页面中嵌套列表功能
  • 基于AVue的二次封装:快速构建后台管理系统的CRUD方案
  • Amazon Lex:AI对话引擎重构企业服务新范式
  • 应用层的协议-http/https的状态码
  • OSPF | 理论 / 实验
  • ubuntu 守护进程
  • QSplashScreen --软件启动前的交互