当前位置: 首页 > article >正文

【机器学习的主要类型】

机器学习的主要类型

  • 1. 监督学习(Supervised Learning)
  • 2. 无监督学习(Unsupervised Learning)
  • 3. 强化学习(Reinforcement Learning, RL)

1. 监督学习(Supervised Learning)

训练数据有 输入(特征) 和 正确的输出(标签),模型通过学习映射关系来进行预测。

典型任务:

分类(Classification):识别邮件是否为垃圾邮件(Spam/Not Spam)。
回归(Regression):预测房价。

常见算法:

线性回归(Linear Regression)
逻辑回归(Logistic Regression)
决策树(Decision Tree)
支持向量机(SVM)
随机森林(Random Forest)
神经网络(Neural Networks)

2. 无监督学习(Unsupervised Learning)

训练数据只有 输入(特征),没有标签,算法通过分析数据结构进行模式发现。

典型任务:

聚类(Clustering):把顾客按购买行为分成不同类别。
降维(Dimensionality Reduction):用 PCA(主成分分析)减少数据维度,提高计算效率。

常见算法:

K-Means 聚类
层次聚类(Hierarchical Clustering)
主成分分析(PCA)
自编码器(Autoencoder)

3. 强化学习(Reinforcement Learning, RL)

通过 试错(Trial & Error) 进行学习,智能体(Agent)与环境交互,并基于奖励或惩罚调整策略,以实现目标最大化。

典型任务:

游戏 AI(如 AlphaGo)
自动驾驶
机器人控制

关键概念:

状态(State):环境的当前情况
动作(Action):智能体可以做的决策
奖励(Reward):智能体的反馈信号,鼓励好的行为

代表算法:

深度 Q 网络(DQN)
近端策略优化(PPO)
深度确定性策略梯度(DDPG)


http://www.kler.cn/a/582058.html

相关文章:

  • HTML5 + Bootstrap5 网站底部代码实现与解析
  • Django系列教程(3)——Django的MVT设计模式
  • 大语言模型(LLM)的微调与应用
  • Elasticsearch 2025/3/7
  • 【漫话机器学习系列】125.普拉托变换(Platt Scaling)
  • 【UNIAPP】获取视频的第一帧作为封面(基于视频URL,Canvas)复制即用
  • git文件过大导致gitea仓库镜像推送失败问题解决(push failed: context deadline exceeded)
  • 在VMware Workstation Pro上轻松部署CentOS7 Linux虚拟机
  • 使用Java爬虫根据关键词获取衣联网商品列表:实战指南
  • 《2025年软件测试工程师面试》MySQL面试题
  • Linux 环境变量快速上手指南
  • 《UI 设计:点亮大数据可视化的智慧之光》
  • 告别手抖烦恼,重拾生活稳 “态”
  • 【物联网-WIFI】
  • 【MySQL】增删改查进阶
  • 【测试框架篇】单元测试框架pytest(5):setup和teardown的详细使用
  • 2.4 基于Vitest的单元测试基础设施搭建
  • DeFi基石ERC4626标准实现一个金库合约
  • 聊一聊大型 Unity 游戏资源打包
  • redis趣味解读