当前位置: 首页 > article >正文

【机器学习基础】西瓜书阅读笔记task01

机器学习的基本概念

机器学习:研究如何通过计算的手段,利用经验来改善系统自身的性能
计算机系统中,经验通常以数据形式存在。机器学习研究的主要内容:计算机从数据中产生模型的算法,即“学习算法”
把经验(经验数据)提供给这个算法,算法就可以基于数据产生模型,在面对新情况时,模型就会给我们提供相应的判断。机器学习就是研究这种“学习算法”的学问。模型就指从数据中学得的结果。

基本术语

数据集(data set):记录的集合,每条记录是关于一个事件或对象的描述,称为一个示例(instance)样本(sample)
也把一个示例称为一个特征向量,以属性为坐标轴,属性值确定在坐标系中的位置的点

不同学习任务的叫法

欲预测的是离散值:分类(classification)
欲预测的是连续值:回归(regression)

对于分类任务,
只涉及两个类别的“二分类”(binary classfication),两个类通常被称为正类和反类
涉及多个类别:多分类(multi-class classification)

预测任务通常希望对训练集进行学习,建立一个从输入控件到输出空间的映射f

聚类(clustering)将训练集中的西瓜分成若干组,每组称为一个(cluster),簇是自动形成的,聚类的依据是我们事先不知道的,而且学习过程中使用的样本通常不拥有标记信息

监督学习和无监督学习:根据训练数据中有无标记信息。
分类和回归是监督学习(supervised learning)的代表,聚类是无监督学习(unsupervised learning)的代表


http://www.kler.cn/a/394510.html

相关文章:

  • 【Kafka】集成案例:与Spark大数据组件的协同应用
  • STM32中,不进行printf改写通过函数达到同款效果
  • Git在版本控制中的应用
  • Java算法OJ(7)随机快速排序
  • C++算法练习-day40——617.合并二叉树
  • Database Advantages (数据库系统的优点)
  • 游戏设计:推箱子【easyx图形界面/c语言】
  • AcWing 1097 池塘计数 flood fill bfs搜索
  • JFlash添加自定义MCU型号
  • 【汇编语言】包含多个段的程序(二)—— 将数据、代码、栈放入不同的段
  • 图像融合self
  • vscode远程连接+免密登录
  • 【Linux学习】【Ubuntu入门】1-3 ubuntu连接USB设备
  • IntelliJ+SpringBoot项目实战(七)--在SpringBoot中整合Redis
  • 职场中天天工作太累太无趣
  • 前端呈现效果:鱼眼相机城市环境图像分割
  • SQL语句执行的基本架构——数据库
  • Dify + Xinference:一站式本地 LLM 私有化部署和应用开发
  • 【C#设计模式(10)——装饰器模式(Decorator Pattern)】
  • 3D意识(3D Awareness)浅析
  • 《InsCode AI IDE:编程新时代的引领者》
  • 【Java】【Spring框架】【复习】1
  • RFC 2018 即《TCP Selective Acknowledgement Options》
  • 两大新兴开发语言大比拼:Move PK Rust
  • 自动驾驶仿真:软件在环(SIL)测试详解(精简版入门)
  • 华为云租户网络-用的是隧道技术