当前位置: 首页 > article >正文

Ai大模型day02神经网络+深度学习

(Aritifcial) Neuron神经网络

Training Objective训练神经网络

缩小损失函数,参数对梯度进行改变,降低损失

Word2Vec 神经网络训练

使用滑动窗口构建

RNN 循环神经网络

门控机制,决定哪些信息传到下一层

CNN 卷积神经网络语言模型

应用NLP、情感分类

cnn和rnn区别
cnn局部处理特征,rnn擅长处理变长的文本,rnn参数两比cnn多一些。rnn前后数据有很强以来关系,不能进行并行化计算。解决办法,用transformer进行加速运算
cnn是数据向量化,前后数据没有很强依赖关系。

NLP Pipeline Tutorial(PyTorch)案例

数据训练流程
1.准备数据
2.建立模型
3.训练模型
4.验证模型
5.测试模型

在这里插入图片描述
cross_entropy是一个常用的用于分类的目标函数。
在这里插入图片描述


http://www.kler.cn/a/579400.html

相关文章:

  • Agentic系统:负载均衡与Redis缓存优化
  • 刷题记录(LeetCode738 单调递增的数字)
  • Web3 的隐私保护机制:如何保障个人数据安全
  • Redis渐进式遍历数据库
  • rpc和proto
  • 【YOLOv12改进trick】多尺度大核注意力机制MLKA模块引入YOLOv12,实现多尺度目标检测涨点,含创新点Python代码,方便发论文
  • 手写Tomcat:实现基本功能
  • CTFHub-FastCGI协议/Redis协议
  • 行式数据库与列式数据库区别
  • 【渗透测试】基于时间的盲注(Time-Based Blind SQL Injection)
  • elasticsearch是哪家的
  • 物联网中如何解决网络复杂性的问题
  • 爬虫去重:数据采集时如何进行去重,及去重优化策略
  • 2025最新Postman、Apipost和Apifox API 协议与工具选择方案解析
  • PG vs MySQL 主从复制的异同点
  • hom_mat2d_to_affine_par 的c#实现
  • hadoop集群HDFS读写性能测试
  • 使用mergekit合并大型语言模型
  • 使用chroot预安装软件到ubuntu22中
  • 【学习笔记】【DeepSeek AI 医生】2-2 AI家庭医生课程内容介绍