机器学习连载
1 机器学习基础知识
机器学习(Machine learning)是人工智能的子集,是实现人工智能的一种途径,但并不是唯一的途径。它是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。
- 什么是机器学习
- 机器学习基本名词
- 机器学习算法分类
- 机器学习模型评估和选择
2 机器学习算法模型
监督学习
- 线性回归
- 逻辑回归算法
- 决策树模型算法
- KNN模型算法
- SVM支持向量机
集成算法
- 随机森林模型算法
- GBDT模型算法
- LightGBM
无监督学习
- 聚类算法-Kmeans
- 降维算法-SVD
- 降维算法-PCA
其它内容
- 混淆矩阵(Confusion Matrix)
- 距离度量方法
- 数据预处理和特征工程
- 去极值-标准化-中性化
3 机器学习实战
.1 Scikit-Learn-机器学习的基本步骤
- 提出问题
- 数据探索
- 数据预处理
- 构建模型
- 评估模型
- 模型优化
- 预测结果
.2 Scikit-Learn学习手册
- 机器学习基础知识
- SKLearn三大核心API
- SKLearn高级API
.3 实践案例
人力资源分析
从kaggle中选择模拟人力资源数据,建立一个分类器,预测在给定属性的情况下,哪些员工更可能离职.
- 人力资源分析1
- 人力资源分析2
- 人力资源分析3
波士顿房价预测
波士顿房地产市场竞争激烈,而你想成为该地区最好的房地产经纪人。为了更好地与同行竞争,你决定运用机器学习的一些基本概念,帮助客户为自己的房产定下最佳售价。
泰坦尼克号乘员的生存
泰坦尼克号(RMS Titanic),又译作铁达尼号,是英国白星航运公司下辖的一艘奥林匹克级游轮,排水量46000吨,是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉 。
Titanic - Machine Learning from Disaster, 比赛很简单:使用机器学习来创建一个模型,预测哪些乘客在泰坦尼克号沉船中幸存下来。