当前位置: 首页 > article >正文

机器学习(一)

一, Supervised Machine Learning (监督机器学习)

        1,定义:学习X到Y或输入到输出的映射的算法,学习算法从正确答案中学习。即教机器   如何做事情(数据集+学习算法=模型),根据已有的数据集,知道输入和输出结果   之间的关系,并根据这种已知的关系,训练得到一个最优的模型(即在面对只有   特征没有标签的数据时,可以判断出标签)。

        2,主要类型:

                回归(regression)和分类(classification)

        回归:学习算法必须从无限多可能的输出数字中预测数字,如预测房价

        分类:学习算法必须对一个类别做出预测,如判断肿瘤的良性或恶性

二,Unsupervised Machine Learning(无监督机器学习)

        1,定义:给定的数据与任何输出标签Y无关,本质上是一个统计的手段,在没有标签的数据里发现潜在的一些结构的训练方式。(让机器自学,学会自己做事情)
        2,类别:

                聚类(clustering) 降维(Dimensionality Reduction) 异常检测(Anomaly Detection)

        聚类:将数据样本分为相似的组别或者簇的过程,通过计算样本之间的相似性来将  相似的样本聚集在一起。如数据分析,市场细分。

       降维:将一个大数据集压缩成一个小得多的数据集,同时尽可能的保留数据的特征。

        异常检测:用于识别与大多数数据样本不同的罕见或者异常数据点。

三,线性回归模型(Linear Regression Model)

        1,监督学习算法过程:

        输入训练集(输入特征+输出目标) ---> 监督学习算法产生函数(function)

        f的作用于新输入的x,进行估计或预测,输出y,此时的y称为y-hat,f称为模型 (model)。(注:y-hat仅是一个估计值,若输出为y,则代表训练集中的实际真实值)

        2,f的表示:

        f(X)=wx+b   (w和b被称为模型的参数,可在训练期间调整的变量)

3,成本函数(cost function)

用于衡量一条直线与训练数据的拟合程度,即

        b=0 时f(x)=wx+0 和 J(x) 关系图象

        线性回归的目标是找到参数w和b,使成本函数J的值最小

        b!=0时 f(x)=wx+b 和 J(x) 关系图象

    

成本函数的最小碗底为同心椭圆的中心点

四,梯度下降(Gradient Descent)

        1,定义:通过迭代找到目标函数的最小值,或者收敛到最小值。
        2,实现过程:

①计算新的w和b

temp_w = w - Alpha * ( J(w,b)对w求一阶导 )

temp_b = b - Alpha * ( J(w,b)对b求一阶导 )

(注:此处Alpha为学习率,Alpha范围在(0,1) )

②同步更新w和b

w = temp_w

b = temp_b

③迭代至找到最小值或收敛到最小值

         3,线性回归中的梯度下降:

公式:


http://www.kler.cn/a/506085.html

相关文章:

  • c#删除文件和目录到回收站
  • C#与Vue2上传下载Excel文件
  • 【数模学习笔记】插值算法和拟合算法
  • Facebook 隐私风波:互联网时代数据安全警钟
  • Termora跨平台 SSH/SFTP/Terminal 客户端工具
  • 每日学习30分轻松掌握CursorAI:Cursor插件系统与扩展功能
  • 基础vue3前端登陆注册界面以及主页面设计
  • centos 7 NFS部署
  • 计算机网络的五层协议
  • 【EI 会议征稿通知】第七届机器人与智能制造技术国际会议 (ISRIMT 2025)
  • Springboot Redisson 分布式锁、缓存、消息队列、布隆过滤器
  • KVM创建ubuntu20.04虚机,部署K8S,再克隆出二份,做为Worker节点加入集群,通过Helm创建2个Pod,让它们之间通过域名互访
  • 解锁转型密码:不同方向的技能与素质修炼手册
  • PHP与HTML、CSS、JavaScript、jQuery的关系**
  • 主动出击,在去中心化世界中成为连接中心
  • 线性变换与矩阵的关系及其在机器学习中的应用
  • GoLang教程004:流程控制和if语句介绍
  • 微信小程序在使用页面栈保存页面信息时,如何避免数据丢失?
  • C#局部函数 VS Lambda表达式
  • LLMs之RAG:《EdgeRAG: Online-Indexed RAG for Edge Devices》翻译与解读
  • 使用 JUnit 和 SuiteRunner 测试私有方法
  • AI辅助编程:快速构建软件原型,开启高效开发新纪元
  • 《探秘火焰目标检测开源模型:智能防火的科技利刃》
  • SpringBoot 集成 Gitee 实现三方登录
  • 5套经典行业原型-含生鲜电商、旅游社交、O2O美食、汽车美容行业
  • python-应用自动化操作方法集合