数据挖掘常用算法
文章目录
- 基于机器学习
- ~~线性/逻辑回归~~
- 树模型
- ~~贝叶斯~~
- ~~聚类~~
- 集成算法
- 神经网络
- ~~支持向量机~~
- ~~降维算法~~
基于机器学习
线性/逻辑回归
类似单层神经网络
y=k*x+b
树模型
优点
- 可以做可视化分析
- 速度快
- 结果稳定
依赖前期对业务和数据的理解
贝叶斯
贝叶斯依赖先验概率,先验知识越准,结果越好
聚类
集成算法
- xgboost
- lightbgm
神经网络
在文本、视觉领域效果非常好。但是过程黑盒,缺乏解释性
支持向量机
降维算法
把一组特征转移到另一个特征空间。类似人的换个视角看问题。
[1*100]⊗[100*10]=[1*10]
例如评价学生成绩有语文成绩、数学成绩、英语成绩等等。使用降维算法并不是之参考一科或几科或者不参考哪科,而是通过算法对各科成绩进行综合计算,得到一组新的评价值。