当前位置: 首页 > article >正文

NLP 复习大纲

CH3

  • 激活函数意义
    增强网络表达能力,引入非线性因素
    连续可导的非线性函数
    尽可能简单
    导数的值域要在合适的范围内

  • 为什么会发生梯度消失
    误差传播的迭代公式为:
    其中需要用到激活函数的导数,而激活函数的导数值小于1时,误差经过每一层传递都会不断衰减,当网络很深的时候,梯度会消失。

  • 损失函数的种类
    绝对值损失函数
    交叉熵损失函数
    平方损失函数

  • 梯度下降方法
    梯度下降:全批次
    随机梯度下降:每一次随机选择一个数据计算梯度
    mini-batch:结合两者
    异同:计算效率,更新频率,样本划分,目标

  • 如何解决梯度消失和过拟合
    选择合适的激活函数,用复杂的们结构代替激活函数,残差结构
    正则化解决过拟合

  • CNN
    由卷积层、子采样层、全连接层交叉堆叠而成

  • 与DNNqubie

  • DNN训练方法
    BP

  • RNN的训练方法
    BPTT

  • BPTT和BP的区别
    BPTT损失函数定义为每一个时刻的损失之和,它会在每一个时间步长内叠加所有对应的权重梯度

  • GNN如何解决邻接节点个数不确定
    将目标节点的特征更新为其自身特征和邻居特征的组合。

  • GNN卷积步骤:1.Aggregation 2.Transformation
    在最后一层(K层)得到每个结点的表示后,可以根据任务将其代入任何损失函数,然后用梯度下降法训练参数

  • GNN训练方法
    卷积,然后在最后一层得到每个节点的表示后,根据任务将其带入任何损失函数,邻接节点特征聚合 ,transformation引入非线性

相较于DNN,CNN,RNN有什么优点?

  • DNN,CNN输入输出定长,RNN处理变长问题效率更高
  • DNN,CNN无法处理时序相关的问题

CNN各层的作用是什么

  • 卷积层:通过卷积操作减少参数
  • 池化层:通过采样减少网络规模
  • 全连接层:将池化层的单元平化

GNN和CNN的区别

  • 卷积思想
    • 核心相同:两者都利用卷积操作从输入中提取特征。
    • 共享权重:CNN在特定区域共享卷积核参数,GNN在邻域节点中共享权重,减少参数量。
    • 特征聚合:两者都通过聚合局部特征(局部连接)生成全局信息。
  • 目标
    • 两者均试图降低模型复杂度,同时保留尽可能多的关键信息。
  • 训练方法
    • 均通过梯度下降法优化损失函数(如交叉熵损失)。
    • 使用类似的反向传播(BP)算法来更新权重。

LSTM VS GRU
门结构不同
LSTM:输入门+遗忘门+输出门
GRU:更新门+重置门
模型参数不同
GRU比LSTM更加简单,参数更少
对memory 的控制不同
LSTM: 用output gate 控制,传输给下一个unit。
GRU:直接传递给下一个unit,不做任何控制。


http://www.kler.cn/a/471461.html

相关文章:

  • 黄仁勋演讲总结(2种显卡,1个开源大模型,1个数据采集平台)
  • iOS - 自定义引用计数(MRC)
  • 《Mcal》--MCU模块
  • Android Audio基础(53)——PCM逻辑设备Write数据
  • 【C++项目实战】类和对象入门实践:日期类实现万字详解
  • 前端学习-操作元素属性(二十三)
  • 华为云服务器一键安装鼎信通达云管系统(详细)
  • HNU人工智能期末复习知识点整理
  • AI赋能金融服务:效率与安全的新高度
  • kvm虚拟机网络桥接和读取ip
  • Conmi的正确答案——Cordova使用“src-cordova/config.xml”编辑“Android平台”的“uses-permission”
  • CNN-BiLSTM-Attention模型详解及应用分析
  • dubbo3 使用注册中心 nacos
  • 网络安全|应急响应沟通准备与技术梳理(Windows篇)
  • Spring Boot整合Minio实现文件上传
  • 设计模式从入门到精通之(三)单例模式
  • mindspore更新set_context()为set_device()
  • 复制粘贴到可见单元格,并且带有原格式-Excel易用宝
  • 无人机+Ai应用场景!
  • 【C++】线程启动、结束与创建线程写法
  • 标准库简介 - STL容器、算法简介
  • 快手短剧播放器uniapp如何引入与对接?
  • Python实战技巧:字典键删除与数据处理
  • Kafka优势剖析-无锁设计与多线程模型
  • git push报错:fatal: Authentication failed for ‘https://gitclone.com
  • 华为ensp-BGP路由引入