当前位置: 首页 > article >正文

【西瓜书《机器学习》前三章内容通俗理解】

第一章:机器学习入门

1.1 什么是机器学习?

核心概念:让计算机通过数据自动 “学习规律”,代替人工编程。例子

  • 你小时候学骑自行车,通过多次尝试记住平衡的感觉,这就是 “学习”。
  • 机器学习类似:比如让电脑看很多猫和狗的图片,它会总结出 “猫耳朵尖、狗鼻子长” 等规律,下次看到新图片就能区分。
1.2 基本术语
  • 数据:学习的原材料(比如很多猫狗的图片)。
  • 特征:用来判断的依据(比如 “耳朵形状”“尾巴长度”)。
  • 标签:结果(比如 “猫” 或 “狗”)。
  • 模型:总结出的规律(比如 “如果耳朵尖且尾巴短,就是猫”)。

例子:假设你想让电脑区分苹果和香蕉:

  • 数据:100 张苹果和香蕉的照片。
  • 特征:颜色(红 / 黄)、形状(圆 / 弯)。
  • 标签:苹果或香蕉。
  • 模型:电脑总结出 “黄色 + 弯曲 = 香蕉”。

第二章:模型评估与选择

2.1 如何判断模型好坏?

准确率:正确判断的比例。例子

  • 电脑区分 100 张猫狗图,对了 90 张,准确率就是 90%。误差:错误判断的比例(比如 10% 的错误率)。
2.2 过拟合 vs 欠拟合
  • 过拟合:学太 “死”,只记住个别例子,没抓住普遍规律。例子:你背下了数学试卷的所有答案,但题目换个数字就不会了。
  • 欠拟合:学太 “浅”,连简单规律都没抓住。例子:你只记住 “数学题都有数字”,但不知道如何解题。

如何避免?

  • 用更多数据训练(比如多做不同的数学题)。
  • 简化模型(比如先学基础公式,再深入)。

第三章:线性模型

3.1 最简单的模型:直线方程

核心思想:用一条直线拟合数据的规律。公式:y = ax + b(a 是斜率,b 是截距)。例子

  • 预测身高:年龄(x)越大,身高(y)越高。假设数据显示:10 岁 140cm,12 岁 150cm,14 岁 160cm。直线方程可能是 y = 5x + 90(10 岁时,5×10+90=140)。
  • 预测考试成绩:学习时间(x)越长,分数(y)越高。假设数据显示:每天学 2 小时得 70 分,4 小时得 80 分。直线方程可能是 y = 5x + 60(2 小时 ×5+60=70)。
3.2 如何找到这条直线?

目标:让直线尽可能接近所有数据点。例子:想象你有一堆散点图(比如年龄和身高的关系),你需要画一条线,让所有点离这条线的距离之和最小。这就像你在玩 “让尽可能多的点靠近一条线” 的游戏!

总结

  • 第一章:机器学习是让电脑从数据中找规律(如区分猫狗)。
  • 第二章:模型好坏看准确率,避免过拟合(死记硬背)和欠拟合(学不会)。
  • 第三章:用直线方程(如 y=ax+b)拟合数据规律,比如预测身高或成绩。

小练习:试试用直线方程预测:

  • 你每天背 30 个单词,背了 5 天,记住了 120 个。
  • 假设规律是线性的,第 6 天能记住多少个?(答案:假设方程是 y=20x+20,第 6 天是 20×6+20=140 个)

http://www.kler.cn/a/569115.html

相关文章:

  • Golang语言特性
  • 【零基础C语言】第四节 数组
  • 网页制作09-html,css,javascript初认识のhtml如何使用表单
  • STM32 微控制器库RCC_ClkInitTypeDef结构参数介绍
  • (十一)基于vue3+mapbox-GL实现模拟高德实时导航轨迹播放
  • C# 类库打包dll文件
  • 数据库原理与使用基础教程
  • 安全测试之五:SQL Server注入漏洞几个实例
  • Linux学习笔记1
  • 差分矩阵问题
  • 什么是预训练语言模型下游任务?
  • 创建一个MCP服务器,并在Cline中使用,增强自定义功能。
  • 通俗解释机器学习中的召回率、精确率、准确率
  • 学习C++常用词汇词组及缩写汇总
  • 腿足机器人之十四-强化学习SAC算法
  • 突破Ajax跨域困境,解锁前端通信新姿势
  • CMake高级特性:构建复杂项目的核心技巧
  • mysqldump 参数详解
  • 公寓管理租房小程序毕业系统设计
  • P10265 [GESP样题 七级] 迷宫统计