当前位置: 首页 > article >正文

支持向量机SVM的MATLAB分类预测实现

支持向量机(Support Vector Machine,SVM)是一种有监督的机器学习算法,广泛应用于分类和回归问题。

理论简介

线性可分SVM

原理:对于线性可分的数据集,SVM的目标是找到一个超平面,能将不同类别的数据点尽可能分开,使两类数据点到超平面的距离最大化。这个超平面可以用方程,w是超平面法向量,b是偏置项

线性SVM(软间隔)

  • 原理:当数据不是完全线性可分时,引入松弛变量,允许一些数据点在一定程度上违反间隔约束,目标是在最大化间隔和最小化分类错误之间找到平衡。

非线性SVM

 原理:对于非线性可分的数据,通过一个非线性映射将原始数据映射到一个高维特征空间,使得在高维空间中数据变得线性可分,然后在这个高维空间中应用线性SVM的方法。

 

决策函数

  • 原理:训练得到SVM模型后,用于对新数据进行分类的函数。

 

%%  清空环境变量
clc                     % 清空命令行
clear                   % 清空变量
warning off             % 关闭报警信息
close all               % 关闭开启的图窗
%%  导入数据
% res = xlsread('数据集.xlsx');
res = xlsread('Long-Term Deflection of Reinforced Concrete Beams_New.xlsx');
[Num, Dim] = size(res);  % 获取数据样本点个数Num和变量维度Dim
%%  划分训练集和测试集
rng(2048)
temp = randperm(Num);
P_train = res(temp(1: round(Num*0.8)), 1: Dim-1)';  % 80%用于训练
T_train = res(temp(1: round(Num*0.8)), Dim)';       % 80%用于训练
M = size(P_train, 2);  % 训练集样本点个数

P_test = res(temp(round(Num*0.8)+1: end), 1: Dim-1)';  % 20%用于测试
T_test = res(temp(round(Num*0.8)+1: end), Dim)';       % 20%用于测试
N = size(P_test, 2);  % 测试集样本点个数

%%  数据归一化
[p_train, ps_input] = mapminmax(P_train, 0, 1); % 训练集输入数据归一化到[0 1]之间
p_test = mapminmax('apply', P_test, ps_input);  % 测试集输入数据归一化

[t_train, ps_output] = mapminmax(T_train, 0, 1); % 训练集输出数据归一化到[0 1]之间
t_test = mapminmax('apply', T_test, ps_output); % 测试集输出数据归一化到[0 1]之间

%%  转置以适应模型
p_train = p_train'; p_test = p_test';
t_train = t_train'; t_test = t_test';

%%  创建模型
c = 4.0;    % 惩罚因子
g = 0.8;    % 径向基函数参数
cmd = [' -t 2',' -c ',num2str(c),' -g ',num2str(g),' -s 3 -p 0.01'];
model = svmtrain(t_train, p_train, cmd);

%%  仿真预测
[t_sim1, error_1] = svmpredict(t_train, p_train, model);
[t_sim2, error_2] = svmpredict(t_test , p_test , model);

%%  数据反归一化
T_sim1 = mapminmax('reverse', t_sim1, ps_output);
T_sim2 = mapminmax('reverse', t_sim2, ps_output);

%%  均方根误差
error1 = sqrt(sum((T_sim1' - T_train).^2) ./ M);
error2 = sqrt(sum((T_sim2' - T_test ).^2) ./ N);

%%  绘图
figure
plot(1: M, T_train, 'r-*', 1: M, T_sim1, 'b-o', 'LineWidth', 1)
legend('真实值', '预测值')
xlabel('预测样本')
ylabel('预测结果')
string = {'训练集预测结果对比'; ['RMSE=' num2str(error1)]};
title(string)
xlim([1, M])
grid

figure
plot(1: N, T_test, 'r-*', 1: N, T_sim2, 'b-o', 'LineWidth', 1)
legend('真实值', '预测值')
xlabel('预测样本')
ylabel('预测结果')
string = {'测试集预测结果对比'; ['RMSE=' num2str(error2)]};
title(string)
xlim([1, N])
grid

%%  相关指标计算
% R2
R1 = 1 - norm(T_train - T_sim1')^2 / norm(T_train - mean(T_train))^2;
R2 = 1 - norm(T_test  - T_sim2')^2 / norm(T_test  - mean(T_test ))^2;

disp(['训练集数据的R2为:', num2str(R1)])
disp(['测试集数据的R2为:', num2str(R2)])

% MAE
mae1 = sum(abs(T_sim1' - T_train)) ./ M ;
mae2 = sum(abs(T_sim2' - T_test )) ./ N ;

disp(['训练集数据的MAE为:', num2str(mae1)])
disp(['测试集数据的MAE为:', num2str(mae2)])

% MBE
mbe1 = sum(T_sim1' - T_train) ./ M ;
mbe2 = sum(T_sim2' - T_test ) ./ N ;

disp(['训练集数据的MBE为:', num2str(mbe1)])
disp(['测试集数据的MBE为:', num2str(mbe2)])

%%  绘制散点图
sz = 25;
c = 'b';

figure
scatter(T_train, T_sim1, sz, c)
hold on
plot(xlim, ylim, '--k')
xlabel('训练集真实值');
ylabel('训练集预测值');
xlim([min(T_train) max(T_train)])
ylim([min(T_sim1) max(T_sim1)])
title('训练集预测值 vs. 训练集真实值')

figure
scatter(T_test, T_sim2, sz, c)
hold on
plot(xlim, ylim, '--k')
xlabel('测试集真实值');
ylabel('测试集预测值');
xlim([min(T_test) max(T_test)])
ylim([min(T_sim2) max(T_sim2)])
title('测试集预测值 vs. 测试集真实值')

 


http://www.kler.cn/a/594832.html

相关文章:

  • 华为IPD研发管理体系的3大核心框架解析
  • HOW - 平时如何保持学习和成长?
  • vscode/windsurf/trae无法识别junit的@Test注解解决办法
  • 如何在 C++ 中运行 DeepSeek R1 LLM
  • AES 简介 以及 C# 和 js 实现【加密知多少系列_3】
  • 用PaddleNLP为GPT-2模型制作FineWeb二进制预训练数据集
  • 【总结】常用API架构类型
  • R语言绘图:小提琴图
  • redis的lua脚本
  • python+requests实现的接口自动化测试
  • 剖析塔能科技:能源精准节能进阶核心驱动力
  • HarmonyOS Next~HarmonyOS应用开发工具:DevEco Testing
  • 阿里云CEN创建实验
  • 设计模式-单一职责
  • 手撕算法之`vector` 扩容、`string` 分割、链表翻转
  • HTTP和RPC的区别
  • 基于AT89C51单片机的自动贩卖机设计
  • CentOS 7.9 安装 Python 3.10 详细步骤及常见问题解决
  • 服务器部署Kong和Konga过程
  • 大数据在智能交通系统中的实时数据分析