当前位置: 首页 > article >正文

揭开面纱--机器学习

一、人工智能三大概念

1.1 AI、ML、DL

1.1.1 什么是人工智能?

AI:Artificial Intelligence 人工智能
AI is the field that studies the synthesis and analysis of
computational agents that act intelligently
AI is to use computers to analog and instead of human brain

AI系统的4大期望:
释义 - 仿智; 像人一样机器智能的综合与分析;机器模拟代替人类

在这里插入图片描述

1.1.2 什么是机器学习?

Machine Learning 释义:机器学习; 自动学习; 机器学
Field of study that gives computers the ability to learn without being explicitly programmed
释义:让机器自动学习,而不是基于规则的编程(不依赖特定规则编程)
在这里插入图片描述

1.1.3 什么是深度学习?

深度学习(DL, Deep Learning) : ,也叫深度神经网络,大脑仿生,设计一层一层的神经元模拟万事万物

在这里插入图片描述

1.2 AI、ML、DL、三者联系和区别

在这里插入图片描述

1.3 算法的学习方式

1.3.1 基于规则的预测

程序员自己手工的if-else方式写经验规则
机器学习出来之前进行预测,需先有一个明确的可解释的规则。 比如垃圾邮件分类
通过 “if…else…” 写很多规则,来对邮件分类!有些场景很难写规则!
例子:大象的识别
在这里插入图片描述

1.3.2 基于模型的学习

从数据中自动学出规律

在这里插入图片描述
例子:房价的预测
在这里插入图片描述

1.4 小结

在这里插入图片描述

二、机器学习的应用领域和发展史

2.1应用领域:

在这里插入图片描述

2.2 机器学习发展史:

在这里插入图片描述

2.3 AI发展三要素

数据、算法、算力三要素互相作用,是AI发展的基石

在这里插入图片描述
要用英伟达的处理器,原因在于其高效的并行处理能力、先进的架构、强大的生态系统支持、以及专为AI优化的硬件功能。
国企一般用华为的升腾处理器。

2.4 小结

在这里插入图片描述

三、机器学习常用术语

3.1 常用术语

在这里插入图片描述

3.2训练集和测试集的划分

在这里插入图片描述
特征:用x表示
目标:用y表示
x_train:训练集中的特征,x_test:测试集中的目标
y_train:测试集中的特征,y_test:测试集中的目标

3.3 小结

在这里插入图片描述

四、算法分类

4.1 有监督学习 Vs 无监督学习

数据上对算法的划分
在这里插入图片描述

有监督学习分为:分类问题和回归问题
在这里插入图片描述
分类种类:
二分类:“是、否”问题
多分类

无监督再举例
在这里插入图片描述

4.2 半监督学习

在这里插入图片描述

4.3强化分类

在这里插入图片描述

4.4 小结

在这里插入图片描述
在这里插入图片描述
机器学习算法可分为哪些类别?分别说一说各自的特点?

1 按照学习方式分类可分为: 监督学习, 无监督学习, 半监督学习, 强化学习
2 监督学习: 输入训练集数据包含输入特征值和目标值
回归: 函数的输出是一个连续的值
分类: 函数的输出是有限个离散值
3 无监督学习: 输入训练集数据是由输入特征值组成,没有目标值
比如:聚类根据样本间的相似性对样本集进行分类
4 半监督学习: 训练集同时包含有目标值的样本数据和不含有目标值的样本数据
5 强化学习: 智能体不断与环境进行交互,通过获取最大奖励的方式(试错的方式)来获得最佳策略;主要包含四个元素:Agent(智能体),环境(Environment),行动(Action),奖励(reward)

五、机器学习建模流程

5.1机器学习建模流程

在这里插入图片描述
注:在整个建模流程中,数据基本处理、特征工程一般是耗时、耗精力最多的。

5.2 有监督学习模型训练和模型预测

在这里插入图片描述

5.3 总结

在这里插入图片描述

六、特征工程概念入门

6.1 特征工程概念入门

在这里插入图片描述
特征提取:原始数据中提取与任务相关的特征,构成特征向量
在这里插入图片描述

特征预处理:特征对模型产生影响;因量纲问题,有些特征对模型影响大、有些影响小
在这里插入图片描述
特征降维:将原始数据的维度降低,叫做特征降维,一般会对原始数据产生影响
在这里插入图片描述
特征选择:原始数据特征很多,与任务相关是其中一个特征集合子集,不会改变原数据
在这里插入图片描述
特征组合:原始数据特征很多,与任务相关是其中一个特征集合子集,不会改变原数据
在这里插入图片描述

6.2 总结

在这里插入图片描述
在这里插入图片描述

七、模型拟合问题

7.1 什么叫拟合?

例如:x轴是年龄,y轴是身高。
红色的f(x)没有拟合x和y
绿色的f(x)拟合了x和y
在这里插入图片描述
模型拟合:就是拟合特征和目标的关系
在这里插入图片描述

7.2 欠拟合和过拟合

例子:识别天鹅
在这里插入图片描述
在这里插入图片描述

7.3 总结

在这里插入图片描述

八、机器学习开发环境

简单高效的数据挖掘和数据分析工具
可供大家使用,可在各种环境中重复使用
建立在NumPy,SciPy和matplotlib上
开源,可商业使用

安装方法:
pip install scikit-learn

在pycharm中验证是否安装成功:
在这里插入图片描述

官网:
https://scikit-learn.org/stable/

在这里插入图片描述
在这里插入图片描述

日拱一卒,功不唐捐,信奉长期主义

每天进步一点点,为中国人工智能的发展贡献力量!

我这么可爱,还等什么?快点关注我哦~


http://www.kler.cn/a/299897.html

相关文章:

  • 2025牛客寒假算法基础集训营2
  • PAT甲级-1023 Have Fun with Numbers
  • idea maven本地有jar包,但还要从远程下载
  • 数仓的数据加工过程-ETL
  • 计算机网络之链路层
  • 黑龙江锅包肉:酸甜香酥的东北经典
  • Ubuntu创建一个虚拟摄像头
  • 【区块链 + 基层治理】链动社区:基于 FISCO BCOS 的智慧社区数字化治理平台 | FISCO BCOS应用案例
  • QQ频道机器人零基础开发详解(基于QQ官方机器人文档)[第二期]
  • Java System.getenv 和 System.getProperty 区别
  • DAY74
  • 【笔记】扩散模型(七):Latent Diffusion Models(Stable Diffusion)论文解读与代码实现
  • Flutter 中的低功耗蓝牙概述
  • 连锁管理系统如何兼批发和零售 连锁收银系统如何配合做好财务
  • C++之函数的分文件编写
  • ToDesk远程连接Ubuntu 2022.04,鼠标动不了,Windows自带的远程桌面连接也连不上,TightVNC Viewer也连不上的解决办法
  • vc-align源码分析 -- ant-design-vue系列
  • transform: rotate 旋转中心在左上角
  • 网络层_计算机网络
  • 智能匹配新高度:相亲交友系统如何运用AI技术提升用户体验
  • 如何选择合适的加密软件?加密软件有哪些用途呢?
  • 心脑血管科黄力主任:血栓是如何悄然“养”大的?医生警示七大高危群体!
  • OPENAIGC开发者大赛高校组银奖 | GOIS——面向地质报告的多场景办公智能助手
  • Linux下载新版火狐浏览器,替换默认火狐浏览器,保留桌面任务栏图标快捷方式
  • 操作系统安全保护
  • 贪心+滑窗+递推,LeetCode 2555. 两个线段获得的最多奖品