当前位置：首页 > article >正文

深度学习笔记——神经网络

article 2025/3/13 0:49:07

本文为在拓尔思智能举办的训练营中学习内容的总结，部分内容摘自百度百科

个人在这里推荐一个好用的软件，Trae，主要是免费。

人工神经元是人工神经网络的基本单元。模拟生物神经元，人工神经元有1个或者多个输入（模拟多个树突或者多个神经元向该神经元传递神经冲动）；对输入进行加权求和（模拟细胞体将神经信号进行积累和树突强度不同）；对输入之和使用激活函数计算活性值（模拟细胞体产生兴奋或者抑制）；输出活性值并传递到下一个人工神经元（模拟生物神经元通过轴突将神经冲动输入到下一个神经元）。

nn.Linear线性层
线性层(Linear Layer)又称全连接层(Full-connected Layer)，其每个神经元与上一层所有神经元相连，实现对前一层的线性组合/线性变换。每个神经元都和前一层中的所有神经元相连，每个神经元的计算方式是对上一层的加权求和的过程。因此，线性层可以采用矩阵乘法来实现。

# nn.Linear(in_features, out_features, bias=True)
layer = nn.Linear(20, 30)
x = torch.randn(128, 20)
y = layer(x)
y.shape

输出：

torch.Size([128, 30])

这个代码实现从20个特征点向30个的自由转移，也就是线性层的作用。

relu函数：

ReLU，全称为：Rectified Linear Unit，是一种人工神经网络中常用的激活函数，通常意义下，其指代数学中的斜坡函数，即f(x)=max(0,x)

他的应用其实就是把小于0的数值归零

激活函数：是对特征进行非线性的变化，赋予多层神经网络具有深度的意义。

参考了该文章一些内容：

深入理解ReLU函数（ReLU函数的可解释性）-CSDN博客

查看全文

http://www.kler.cn/a/576585.html

大模型开发（四）：PET项目——新零售决策评价系统（上）

Java基础关键_018_集合（二）

数据结构——单调栈

腾讯云大模型知识引擎驱动DeepSeek满血版能源革命大模型：架构、优势与产业变革

文档进行embedding，Faiss向量检索

Facebook 与文化多样性：社交平台中的语言与文化差异

基于Spring Boot的校园失物招领系统的设计与实现（LW+源码+讲解）

一站式3D虚拟展厅搭建方案，让企业展示更高效

无人机灯光原理与应用解析！

深入解析动态住宅IP

六十天前端强化训练之第十二天之闭包深度解析

Docker安装milvus及其基本使用说明

Manus如何应对数据安全与合规风险？

新版全开源短剧平台上百案例,带支付收益模式，支持媒资管理/广告回传

docker oracle11

k8s1.30 监控并限制节点使用资源（kubelet+metrics-server）

深入解析网络协议：从OSI七层模型到HTTP与TCP/IP的关系

使用PHP实现异步编程：挑战与解决方案

DeepSeek-R1：使用KTransformers实现高效部署指南

面试java做了一道逻辑题，人麻了

相关文章：