当前位置: 首页 > article >正文

从训练数据视角:看机器学习和深度学习的大三范式

从训练数据视角:机器学习和深度学习 “模型”的大三范式

训练数据一般分为两个部分,一部分是数据本身,一部分是标注(Label)。训练是通过数据对应的标注,让模型理解数据。

1.监督学习

即训练直接输入数据和对应的标注,让模型能识别数据的标注。

1.1 半监督学习

利用无标记数据来训练一个辅助分类器或者利用无标记数据来学习数据分布,从而改进有标记数据的分类效果。这些技术包括自编码器、半监督SVM、深度置信网络等。

2.无监督学习

即训练数据没有标注

Tips:通常将生成模型归为无监督学习

2.1 自监督学习

利用无标记的数据来自动生成标签或者特征,然后利用这些生成的标签或者特征来训练模型。

即通过大量的无标记数据,学习数据的内在结构和特征,从而产生高质量的表示,这些表示可以被用于各种任务,例如分类、目标检测、图像分割等。

3.强化学习

强化学习是通过探索未知数据来学习一切可能的结果,从而找到最佳结果。

强化学习需要记录连续的行动和状态空间,类似一个二维矩阵,俗称Q表或Q-Learning

定义了一个环境和一个代理。代理可以观察环境,并根据观察结果采取行动。

每次代理采取行动后,环境会反馈一个奖励信号,告诉代理这个行动是好的还是坏的。代理的目标是通过不断尝试和学习来最大化累积奖励信号。代理的学习过程通常是基于试错(trial-and-error)的,通过尝试多种行动并观察结果来更新策略。


http://www.kler.cn/a/14987.html

相关文章:

  • 太为难我了,阿里面试了7轮...
  • python内置数据结构常见操作易错总结[更新ing...]
  • 一文看懂低代码,5分钟从入门到原理全搞定
  • 【地铁上的设计模式】--创建型模式:建造者模式
  • 线程同步方式之三信号量
  • 电脑高效率工作、学习工具软件推荐
  • pwm调节亮度
  • Springboot +Flowable,通过代码绘制流程图并设置高亮
  • 车联网OTA安全实践
  • 2023年全国最新保安员精选真题及答案62
  • 计算机专业VB系统,有论文,源代码
  • 【Linux常见指令以及权限理解】基本指令(2)
  • Python自动化测试框架之unittest使用详解
  • 如何使用python网络爬虫批量获取公共资源数据
  • 用梯度下降的方式来拟合曲线
  • 使用virsh远程连接主机遇到的问题
  • Java版本+企业电子招投标系统源代码之电子招投标系统建设的重点和未来趋势
  • 矢量、栅格、瓦片地图傻傻分不清
  • 封装了一个echarts图全屏放大的功能
  • NetApp ONTAP: 企业级数据管理软件,为无缝混合云奠定基础