当前位置: 首页 > article >正文

2021李宏毅机器学习 1 机器学习基础 笔记

机器学习的任务:

- regression:输出是一个标量scalar;

- classification:给出多个classes,输出正确的类别;

- structured learning:创造有结构的东西,比如生成一个图片或者文档;



机器学习完成任务,是通过找到一个function来实现的,一个案例学习:以youtube每天的点击量预测为例

1. 先写出一个有未知参数的function作为model,想用哪个函数来实现任务;介绍model,feature,weight,bias四个概念


2. 定义一个loss function:L(b, w),它是一个把上述未知参数作为自变量的函数,这个函数是要评价这些参数的设定究竟好不好,通过training data进行计算


选择一个loss函数,这里用了预测结果与label的绝对误差的平均值作为了loss,loss函数有很多种形式。通过training data使用目前确定的w和b来得到预测结果,计算loss。

3. 进行优化:表现最好的参数,是能让loss最小的参数,所以要针对这一问题进行优化


优化方法:gradient descent(梯度下降)


以一个参数的优化过程为例如上图;目前可以看到的GD的缺陷:可能无法找到全局最小值,而是陷入到局部极小值处;比如上图到了w1右边的极小值点,再怎么更新都无法跑到再右边的最小值去了。(但是老师说GD真正的痛点并不是这个)

超参数 hyperparameters

在机器学习中需要自己设定的参数

上述三步是机器学习的训练过程,根据已知的trainning data进行模型的训练;下面进行测试,看一下测试的效果,可能会比较不如意;

4. 根据测试的结果,根据你的domain knowledge,需要对模型进行修改。

比如对观看人数的预测,你发现明显数据是七天一周期的变化,那用前七天来进行预测显然比用前一天的预测更加好一些。




Linear Model

(上面的例子就是一个linear model)

线性模型太简单,特征和label的关系永远都是线性的,但是事实上可能有非线性的关系,那线性模型无论怎么训练都无法很好的拟合了。

这种局限叫做model bias。

最后编辑于:2024-10-27 15:05:30


喜欢的朋友记得点赞、收藏、关注哦!!!


http://www.kler.cn/a/375165.html

相关文章:

  • 探索AI代理在《我的世界》中的奇妙之旅:代理IP的角色与影响
  • 利用.NET Upgrade Assitant对项目进行升级
  • BunkerWeb 开源项目安装与使用教程
  • IntelliJ IDEA 快捷键大全:提升开发效率的利器
  • Redis存在安全漏洞
  • curl也支持断点续传
  • 树莓派开发相关知识六 -串口通讯
  • TCP/IP网络编程:理解网络编程和套接字
  • 【面试每日一题之CSS】2、line-height和heigh区别
  • Spring Boot实战:打造现代租房管理系统
  • 如何用猿大师办公助手实现OA系统中Word公文/合同在线编辑及流转?
  • YOLOv6-4.0部分代码阅读笔记-loss_fuseab.py
  • Gitee push 文件
  • 【CRM系统选型指南:国内九大主流工具比较】
  • 专业140+总分430+四川大学854信号与系统考研川大原951电子信息与通信工程,真题,大纲,参考书。
  • 《证据规定》之对鉴定意见异议的处理
  • java项目之基于springboot的疾病防控综合系统的设计与实现(springboot)
  • 微信jssdk在企业微信中失效
  • BGP路径属性与路由反射器
  • 下划线命名转驼峰
  • 链表 算法专题
  • NCCL安装(Ubuntu等)
  • Python -- 网络爬虫
  • 如何将ppt转换成word文档?8款ppt转word免费的软件大揭秘,值得收藏!
  • js的小知识
  • 小牛视频翻译 ( 视频翻译 字幕翻译 字幕转语音 人声分离)