当前位置: 首页 > article >正文

Decision Tree Regressor (决策树) --- 论文实战

一、前言

       在《机器学习论文复现实战---linear regression》中通过Pearson 相关性分析,去除了2个高相关性特征 "PN" 和 "AN" ,数据维度变为890*25。(数据集地址)

 这里我们不做前期处理,直接就将数据放入 DecisionTreeRegressor 模型中进行训练了。

二、模型训练过程

 2.1  导入Python库

'''====================导入Python库===================='''
import pandas as pd               #python科学计算库
import numpy as np                #Python的一个开源数据分析处理库。
import matplotlib.pyplot as plt   #常用Python画图工具
from sklearn.tree import DecisionTreeRegressor  # 导入 DecisionTreeRegressor 模型
from sklearn.model_selection import train_test_split # 数据划分模块
from sklearn.preprocessing import StandardScaler   # 标准化模块
from sklearn.metrics import mean_squared_error,r2_score   #误差函数MSE,误差函数R^2,
from sklearn.model_selection import GridSearchCV     #超参数网格搜索

2.2  导入数据 

'''========================导入数据========================'''
data = pd.read_excel('D:/复现/trainset_loop6.xlsx')  #读取xlsx格式数据
# date = pd.read_csv('D:/复现/trainset_loop6.csv')   #读取csv格式数据
print(data.isnull().sum())   #检查数据中是否存在缺失值
print(data.shape)   #检查维度
print(data.columns) #数据的标签
data = data.drop(["PN","AN"], axis = 1) #axis = 1表示对列进行处理,0表示对行
Y, X = data['Eads'] , data.drop(['Eads'] , axis = 1) #对Y、X分别赋值

 2.3  标准化

'''=========================标准化========================'''
#利用StandardScaler函数对X进行标准化处理
scaler = StandardScaler()
X = scaler.fit_transform(X)
'''====================划分训练集与测试集==================='''
X_train,X_test,y_train,y_test = train_test_split(X , Y , test_size=0.2 , random_state=42)

2.4  模型训练

'''================

http://www.kler.cn/a/377378.html

相关文章:

  • Linux 下信号的保存和处理
  • 30天开发操作系统 第 12 天 -- 定时器 v1.0
  • ue5 蒙太奇,即上半身动画和下半身组合在一起,并使用。学习b站库得科技
  • 常见的开源网络操作系统
  • 【HarmonyOS NEXT】鸿蒙应用实现屏幕录制详解和源码
  • 【MySQL 保姆级教学】用户管理和数据库权限(16)
  • Apache Calcite - 查询优化之自定义优化规则
  • 用Python设置、更新和获取Excel单元格的值
  • 智能医疗文档处理:开源OCR系统解析
  • 使用 PyCharm 构建 FastAPI 项目:零基础入门 Web API 开发
  • DDR Study - LPDDR4 TTR/PPR/ECC/PASR/DBI
  • 极简实现酷炫动效:Flutter隐式动画指南第三篇自定义Flutter隐式动画
  • ADRV9009 跳频时间测试
  • npm入门教程15:npm 安全性
  • Xamarin 存档报错 XABLD7000 Xamarin.Tools.Zip.ZipException
  • Java集合框架面试指南
  • 从网络到缓存:在Android中高效管理图片加载
  • 使用Git LFS管理大型文件
  • 适用于 c++ 的 wxWidgets框架源码编译SDK-windows篇
  • 【蔬菜识别】Python+深度学习+CNN卷积神经网络算法+TensorFlow+人工智能+模型训练
  • el-date-picker日期选择器动态设置日期
  • 基于python的语音识别与蓝牙通信的温控系统
  • 2024年大厂AI大模型面试题精选与答案解析
  • ffmpeg常用命令
  • RabbitMQ的主题模式
  • ensp中acl的使用