当前位置: 首页 > article >正文

学习笔记-主成分分析法

定义
        

        主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。

数据降维的作用

        降维是将高维度的数据(指标太多)保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常广泛的数据预处理方法。
降维具有如下一些优点:
        1.使得数据集更易使用;
        2.降低算法的计算开销;
        3.去除噪声;
        4.使得结果容易理解。

基本流程

 补充总结

 PCA的数学思想:

        根据p个特征的线性组合,得到一个新的特征z,使得该特征的方差最大,该特征即为主成分。
        再次寻找p个特征的线性组合,得到新的特征,该特征与之前得到的主成分线性无关,且方差最大。
其余要点:

        如果每个主成分的贡献率都相差不多,则不建议使用PCA。因为它一定程度上舍弃了部分信息,来提高整体的计算效率。
        对于降维形成的主成分,我们经常无法找到其在实际情况中所对应的特征,即主成分的解释其含义一般带有模糊性,不像原始变量的含义那么清楚确切,这也是PCA的缺陷所在。
        PCA不可用于评价类模型。可用于聚类、回归,如回归分析解决多重共线性。


http://www.kler.cn/a/15512.html

相关文章:

  • 杰控通过 OPCproxy 获取数据发送到服务器
  • Javascript——设计模式(一)
  • SpringCloud篇(服务网关 - GateWay)
  • 【Mysql】Mysql的多表查询---多表联合查询(上)
  • React Native 全栈开发实战班 - 网络与数据之网络请求基础
  • Swift的可选绑定(Optional binding)
  • SpringBoot+Vue3实现登录验证码功能
  • CentOS计划任务的用法
  • 学系统集成项目管理工程师(中项)系列13a_人力资源管理(上)
  • Whistle安装与使用
  • javaEE+mysql学生竞赛管理系统
  • 亚马逊广告怎么做?广告效果如何提升?
  • 六级英语历年真题单词--按年份分类--持续更新中...
  • 【Java笔试强训 8】
  • 文件 IO 操作
  • jQuery知识点三
  • Linux命令集(Linux常用命令--cat指令篇)
  • 中级软件设计师备考---信息系统安全
  • 最新国内免费chatgpt 的试用方法
  • 首期smardaten无代码训练营圆满收官,两周内容精彩回顾!
  • 基于opencv的YOLOV3对图片的目标检测
  • 【力扣-141】 环形链表 + 【力扣-142】 环形链表 II
  • Flink之TaskManager内存解析
  • 美团赴抖音之“约”:让本地生活补贴大战来得更猛烈些?
  • win11安装双系统ubuntu20.04指导
  • Openwrt搭建php页面