当前位置: 首页 > article >正文

深度学习笔记——神经网络

本文为在拓尔思智能举办的训练营中学习内容的总结,部分内容摘自百度百科

个人在这里推荐一个好用的软件,Trae,主要是免费。

人工神经元是人工神经网络的基本单元。模拟生物神经元,人工神经元有1个或者多个输入(模拟多个树突或者多个神经元向该神经元传递神经冲动);对输入进行加权求和(模拟细胞体将神经信号进行积累和树突强度不同);对输入之和使用激活函数计算活性值(模拟细胞体产生兴奋或者抑制);输出活性值并传递到下一个人工神经元(模拟生物神经元通过轴突将神经冲动输入到下一个神经元)。

nn.Linear线性层
线性层(Linear Layer)又称全连接层(Full-connected Layer),其每个神经元与上一层所有神经元相连,实现对前一层的线性组合/线性变换。每个神经元都和前一层中的所有神经元相连,每个神经元的计算方式是对上一层的加权求和的过程。因此,线性层可以采用矩阵乘法来实现。

# nn.Linear(in_features, out_features, bias=True)
layer = nn.Linear(20, 30)
x = torch.randn(128, 20)
y = layer(x)
y.shape

输出:

torch.Size([128, 30])

这个代码实现从20个特征点向30个的自由转移,也就是线性层的作用。

relu函数:

ReLU,全称为:Rectified Linear Unit,是一种人工神经网络中常用的激活函数,通常意义下,其指代数学中的斜坡函数,即f(x)=max(0,x)

他的应用其实就是把小于0的数值归零

激活函数:是对特征进行非线性的变化,赋予多层神经网络具有深度的意义。

参考了该文章一些内容:

深入理解ReLU函数(ReLU函数的可解释性)-CSDN博客


http://www.kler.cn/a/576585.html

相关文章:

  • 大模型开发(四):PET项目——新零售决策评价系统(上)
  • Java基础关键_018_集合(二)
  • 数据结构——单调栈
  • 腾讯云大模型知识引擎驱动DeepSeek满血版能源革命大模型:架构、优势与产业变革
  • 文档进行embedding,Faiss向量检索
  • Facebook 与文化多样性:社交平台中的语言与文化差异
  • 基于Spring Boot的校园失物招领系统的设计与实现(LW+源码+讲解)
  • 一站式3D虚拟展厅搭建方案,让企业展示更高效
  • 无人机灯光原理与应用解析!
  • 深入解析动态住宅IP
  • 六十天前端强化训练之第十二天之闭包深度解析
  • Docker安装milvus及其基本使用说明
  • Manus如何应对数据安全与合规风险?
  • 新版全开源短剧平台上百案例,带支付收益模式,支持媒资管理/广告回传
  • docker oracle11
  • k8s1.30 监控并限制节点使用资源(kubelet+metrics-server)
  • 深入解析网络协议:从OSI七层模型到HTTP与TCP/IP的关系
  • 使用PHP实现异步编程:挑战与解决方案
  • DeepSeek-R1:使用KTransformers实现高效部署指南
  • 面试java做了一道逻辑题,人麻了