当前位置: 首页 > article >正文

使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测。

1、导入需要的包

# 导入鸢尾花数据集
from sklearn.datasets import load_iris
# 数据可视化包
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler, StandardScaler
from sklearn.neighbors import KNeighborsClassifier

2、获取鸢尾花数据集 

iris = load_iris()

3、数据可视化 

iris_data1 = pd.DataFrame(data=iris['data'], columns=['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width'])

 4、填充目标值

iris_data1['target'] = iris['target']

5、 数据集的划分 

x_train, x_test, y_train, y_test = train_test_split(iris['data'], iris['target'], test_size=0.2, random_state=42)

6、特征工程 - 特征预处理 

transfer = StandardScaler()
ret_train_data = transfer.fit_transform(x_train)
ret_test_data = transfer.fit_transform(x_test)

7、构建KNN并实例化

n_neighbors_num = 5
knn_model = KNeighborsClassifier(n_neighbors=n_neighbors_num)
# 7.2 训练模型 输入训练集和训练集标签
knn_model.fit(ret_train_data, y_train)

8、 评估模型

y_pre = knn_model.predict(ret_test_data)
print("预测结果:", y_pre)
print("真实值:", y_test)
print("预测值和真实值对比:\n", y_pre == y_test)
# 8.2 准确率计算,注意如果是归一化后的数据就得用归一化后的数据进行预测计算准确率,不然效果很差
score = knn_model.score(ret_test_data, y_test)
print("准确率:", score)


http://www.kler.cn/a/525291.html

相关文章:

  • 深入探讨:服务器如何响应前端请求及后端如何查看前端提交的数据
  • Unity 粒子特效在UI中使用裁剪效果
  • typescript 简介
  • 【Pandas】pandas Series cov
  • DFS深度优先搜索
  • DeepSeek LLM解读
  • SpringBoot+Vue的理解(含axios/ajax)-前后端交互前端篇
  • 【开源免费】基于SpringBoot+Vue.JS社区智慧养老监护管理平台(JAVA毕业设计)
  • gif动画图像优化,相同的图在第2,4,6帧中重复出现,会增加图像体积吗?
  • 迭代推理机制提升AI精准性
  • 一文简单回顾Java中的String、StringBuilder、StringBuffer
  • 【阅读笔记】基于图像灰度梯度最大值累加的清晰度评价算子
  • Python里的小整数问题挺有意思的
  • 【NLP251】NLP RNN 系列网络
  • pytorch线性回归模型预测房价例子
  • 乐优商城项目总结
  • AI大模型开发原理篇-3:词向量和词嵌入
  • Ubuntu 16.04安装Lua
  • Yii框架中的正则表达式:如何实现高效的文本操作
  • 【Unity教程】零基础带你从小白到超神part3
  • 观察者模式和订阅发布模式的关系
  • 03链表+栈+队列(D1_链表(D1_基础学习))
  • hdfs之读写流程
  • AI学习指南Ollama篇-使用Ollama构建自己的私有化知识库
  • 【单细胞-第三节 多样本数据分析】
  • 大模型(LLM)工程师实战之路(含学习路线图、书籍、课程等免费资料推荐)