黑马程序员Python机器学习|1机器学习概述
一 人工智能概述
1.什么是人工智能
2.机器学习和人工智能,深度学习的关系
机器学习的目的:用机器来模仿人类学习以及其他方面的智能。
数据库存储历史数据(离线数据),数据挖掘建立在过去数据的基础上,找数据的关联,数据挖掘需要统计分析技术处理数据,模式是行为,大数据最早应用在模式识别上,使用人工智和数据挖掘能做信用卡欺诈的识别。每年收入只有十万,但是信用卡里有一百万,就不能拿这一百万去买房子。因为没有偿还能力。不许在短时期内刷出一百万。突击刷出一百万。短期刷出还款极限的金额。信用卡欺诈罪。
神经计算是神经网络,属于深度学习。人工智能包括机器学习和深度学习,人工智能不等于机器学习,神经网络不等于神经计算。
二 什么是机器学习
1.机器学习的定义
机器学习是实现人工智能的途径,模仿人的一些功能。
学习:训练。
从数据中学习,学习后得出的结论是模型(规律),通过这个规律去解决问题(做预测)。
3.数据集的构成
数据集:要学习的数据。
目标值:房屋价格。(预测的结果)
房屋的各个属性:特征值(4个)
一个班级里的人,并没有特别安排,但是过几天就会各种小团体,物以类聚,人以群分。没有目标值,但是也可以分成一堆一堆的,根据特征相近就分成一个堆。这就是没有目标值。
4.机器学习的分类
监督学习
A 分类问题
特征值:这些图片。
目标值:是猫还是狗。(类别)
把目标值是类别的问题叫做分类问题。
数据里面有特征值和目标值,并且目标值是一个分类,这就是分类问题。
目标值是离散型数据。
B 回归问题
有特征值和目标值,特征值是面积,朝向等,目标值是房屋的价格。(具体的值)
目标值是连续型数据。属于回归问题。
无监督学习
无目标值的属于无监督学习。
5.机器学习可以做什么
智能客服。
计算机视觉更多的是深度学习。
推荐系统。
强化学习。
6.机器学习和数据挖掘的关系
7.机器学习三要素
训练过程到底按照什么样的准则去学习或者选择?这个准则就是学习策略。
学习策略比如宁可错杀也不放过的思想。
8.机器学习算法的分类
在线学习(实时学习):指每次接受一个样本,进行预测,之后学习模型,并不断重复该操作的机器学习。有些实际应用场景要求学习必须是在线的,实时推荐。
批量学习(离线学习):一次接受所有数据,学习模型,之后预测。
1、 模型训练过程低效 2、 训练过程不易拓展于大数据场景。 3、 模型无法适应动态变化的环境。
三 机器学习开发流程
获取数据,对数据处理(数据预处理),特征工程(数据处理,处理成能被算法使用的数据,特征值),选择合适算法进行训练得到模型(机器学习),进行模型评估(评估不好就要返回到数据预处理循环,直到模型应用,要用数据对模型进行评估)
四 学习框架和资料介绍
1.明确问题
算法的改进,也要有数据的积累,有大量的数据,再用算法进行训练,数据量大要进行训练也很消耗计算机,对计算机的要求也比较高。
确定在开发过程中定位到哪个方向。
2.大学的学习步骤:
库和框架,算法底层怎么实现的,怎么实例化的。
应用
3.建议学习方法
从实际例子入手是入门快的方法,分析问题,使用机器学习算法解决一些简单的任务。
先学会用库和框架解决问题。用别人有的工具来造轮子。
A 入门,知道是干什么的,可以实现怎样的效果,有了自学能力。
B 知道往哪个方向发展后,可以看实战类书籍。
C 为什么这个算法效果这么好,背后用到了什么,数学原理是什么,就可以看理论书。