当前位置: 首页 > article >正文

【西瓜书】神经网络-MP神经元、感知机和多层网络

  • 神经网络(neural networks)的定义:神经网络是由具有适应性的简单单元组成的广泛并行互联的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。(T. Kohonen 1988年在Neural Networks创刊号上给出的定义)。
  • 在机器学习中谈论神经网络时,指的是神经网络学习。
  • 神经网络中最基本的成分是神经元(neuron)模型。即上述定义中的简单单元。neuron 也称 unit。
  • 生物神经网络中,每个神经元与其他神经元相连,当它“兴奋”时,就会向相邻的神经元发生化学物质,从而改变这些神经元内的电位;如果某神经元的电位超过了一个“阈值”(threshold),那么它就会激活,即“兴奋”起来向其他神经元发送化学物质。threshold 也叫 bias。

M-P神经元模型

来源于西瓜书-P97
  • 在这个模型中,神经元接收到来自n个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接(connection)进行传递,神经元接收到的总输入值将与这个神经元的阈值进行比较,然后通过“激活函数”(activation function)处理以产生神经元的输出。
  • 产生“0”和“1”最好的函数时阶跃函数,但阶跃函数有不连续、不光滑等不太好的性质,实际常用 Sigmoid 函数作为激活函数,它能把较大范围内变化的数值挤压到(0, 1)输出值范围内,因此也被称为“挤压函数”(squashing function)。

感知机模型

来源于西瓜书-P99
  • 感知机(Perception)由两层神经元组成。输入层接收外界输入信号后传递给输出层,输出层是M-P神经元。也称“阈值逻辑单元”(threshold logic unit)。
  • 感知机可能容易地实现逻辑与、或、非运算。
  • 阈值θ可看作一个固定输入为-1.0的“哑节点”(dummy node)所对应的连接权重。
  • η∈(0, 1) 称为学习率(learning rate),通常设置为一个小正数。
  • 感知机只有输出层神经元进行激活函数处理,即只拥有一层功能神经元(functional neuron)。
  • 事实上,与、或、非问题都是线性可分问题(linearly separable)问题,即存在一个线性超平面能将他们分开,这时感知机的学习过程一定会收敛(converge)而求得适当的权向量。否则感知机的学习过程将会发生振荡(fluctuation)。
  • 非线性可分意味着用线性超平面无法划分。

多层网络

来自西瓜书-P101
  • 要解决非线性可分问题,需考虑使用多层功能神经元。
  • 输入和输出层之间的一层神经元,被称为隐层或隐含层(hidden layer),隐含层和输出层都是拥有激活函数的功能神经元。
  • 只需要包含隐层,即可称为多层网络。
  • 每层神经元与下一层神经元全连接,神经元之间不存在同层连接,也不存在跨层连接,这样的神经网络就通常称为“多层前馈神经网络”(Multi-layer feedforward natural networks)。“前馈”并不意味着网络中的信号不能向后传,而是指网络拓扑结构上不存在环或回路。
  • 输入层神经元仅接受输入不进行函数处理,隐层与输出层包含功能神经元。
  • 神经网络的学习过程,就是根据训练数据来调整神经元之间的“连接权”(connection weight)以及每个功能神经元的阈值。也就是说,神经网络学到的东西蕴含在连接权与阈值中。

http://www.kler.cn/a/417740.html

相关文章:

  • 记录pve中使用libvirt创建虚拟机
  • 从Transformer到世界模型:AGI核心架构演进
  • 1.攻防世界easyphp
  • 自研有限元软件与ANSYS精度对比-Bar3D2Node三维杆单元模型-央视大裤衩实例
  • AI 编程工具—Cursor进阶使用 Agent模式
  • DeepSeekMoE:迈向混合专家语言模型的终极专业化
  • 华为手机卡死了屏幕动不了关机也关不了
  • 51单片机从入门到精通:理论与实践指南常用资源篇(六)
  • 遥感数据集:FTW全球农田边界和对应影像数据,约160万田块边界及7万多个样本
  • expect免交互
  • 【知识科普】简单讲讲Socket通讯协议
  • 代理IP地址的含义与设置指南‌
  • 宠物领养平台建设:SpringBoot案例分析
  • linux一键部署apache脚本
  • Power BI - Connect to SharePoint online list with Image column
  • CSS学习记录01
  • 【xLSTM-Transformer序列预测源代码】
  • Jmeter 接口测试常见场景
  • 【开源免费】基于Vue和SpringBoot的技术交流分享平台(附论文)
  • [C++数据结构]map与set的模拟实现
  • mapstruct DTO转换使用
  • 【人工智能学习之STGCN训练自己的数据集】
  • 深度学习每周学习总结J7(对ResNeXt-50 算法的思考)
  • 洛谷P1443 马的遍历
  • 电路基础——相量法
  • 积鼎科技携手西北工业大学动力与能源学院共建复杂多相流仿真联合实验室