当前位置: 首页 > article >正文

数据可视化02-PCA降维

一、PCA

PCA做什么?找坐标系。

目标?二维降到一维,信息保留最多。

怎么样最好?数据分布最分散的方向(方差最大),作为主成分(坐标轴)。

二、怎么找主成分?

PC1的确定:每个点的 b^{2} 之和最小,c^{2} 之和最大。

PC2的确定:过原点,且与PC1垂直。

PCA降维的核心思想是:用少数几个最重要的方向(主成分PC1)来表示数据,而不是用所有方向。

为什么可以降噪?

  1. 舍弃次要方向: 噪声(偏离的点)通常分布在次要方向(如PC2)上,降维时舍弃这些方向,相当于过滤了一部分噪声。

  2. 压缩噪声的影响: 即使噪声点在PC1上仍有偏离,它们的偏离程度比在原始数据中要小。

三、特征值与特征向量

(一)特征向量

简单来说,特征向量定义了新的坐标轴的方向

(二)特征值

特征值表示了每个主成分在数据集中的方差贡献率

(三)碎石图


http://www.kler.cn/a/569795.html

相关文章:

  • 【推荐项目】023-游泳俱乐部管理系统
  • 解决Java项目中Maven爆红,三方包下载不下来的问题
  • 基于单片机和C#的电压监测系统设计
  • Docker 学习(一)
  • 如何在 FastAdmin 中实现自定义主题设计
  • 比较Spring AOP和AspectJ
  • Qt QScrollArea 总结
  • iOS UIGestureRecgonizer自动化点击埋点
  • 计算机毕设JAVA——某高校宿舍管理系统(基于SpringBoot+Vue前后端分离的项目)
  • MySql面试总结(一)
  • 鸿蒙自定义组件预览
  • linux 后台执行并输出日志
  • STM32中使用PWM对舵机控制
  • 如何在Python用Plot画出一个简单的机器人模型
  • 【自学笔记】大数据基础知识点总览-持续更新
  • P8651 [蓝桥杯 2017 省 B] 日期问题--注意日期问题中2月的天数 / if是否应该连用
  • 深度学习-10.门控循环网络
  • 《STL源码剖析》笔记记录
  • Unity中动态切换光照贴图LightProbe的方法
  • 服务流程设计和服务或端口重定向及其websocket等应用示例