机器学习-1
1. 机器学习算法分类
- 监督学习(supervised learning)预测
- 定义:输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或者是输出有限个离散值(称作分类)。
- 目标值:类别-分类问题
- 目标值:连续型的数据-回归问题
- 分类问题:k-近邻算法,贝叶斯分类,决策树与随机森林,逻辑回归
- 回归问题:线性回归,岭回归
2. 无监督学习(unsupervised learning)
- 定义:输入数据是由输入特征值所组成。
- 聚类 k-means
2. 机器学习开发流程
- 获取数据
- 数据处理
- 特征工程
- 机器学习算法训练 - 模型
- 模型评估
- 应用
3. 学习框架和资料介绍
-
明确几个问题
- 算法是核心,数据与计算是基础
- 找准定位
- 大部分复杂模型的算法设计都是算法工程师在做,而我们
- 分析很多的数据
- 分析具体的业务
- 应用常见的算法
- 特征工程,调参数,优化
-
找实战类数据看
- 入门
- 机器学习 - 周志华 - “西瓜书”
- 统计学习方法 - 李航
- 深度学习 - “花书”
- 先学会分析问题,使用机器学习算法 的目的,想要算法完成何种任务。
- 掌握算法基本思想,学会对问题用相应的算法解决
- 学会利用库或者框架解决问题
-
机器学习库与框架
- 机器学习:scikit-learn
- 深度学习:pytorch ,tensflow