当前位置: 首页 > article >正文

llm知识梳理

前一阵子梳理llm的时候总是在纸上写下来,现在发现有一些还是需要上点图的,谨此文章记录学习过程,有说错的地方可以指出~

网络结构

优化方式

多样化生成

CoT

 CoT 的发展方向有三条主要的路径,分别是 “Prompt 模式”,“推理结构”以及“应用场景”

Prompt 模式

ActivePrompt:半人工生产,从数据集里面挑选出多个回答差异最明显的问题,进行此类问题的人工标注。(论文中叫【不确定度度量】)

Auto-CoT:
1. 将给定数据集中的问题聚为不同的簇(kmeans)

2. 从每个簇中选择代表性的问题,通过Zero-Shot-CoT的方式生成reasoning chain。(都使用lets think step by step,并且选择时采用简单的启发是规则,例如最短的等)

3. 作为prompt,一起输入到llm中,变成一个fewshot learning

 

 推理结构

 

 其实就是将COT用不同的方式表达

应用场景

多模态

第一篇多模态:MM-CoT,主要就是通过视觉特征来生成思维链,得到最后的结果。


http://www.kler.cn/a/456233.html

相关文章:

  • 沪深300股指期货一点多少钱?
  • 【源码 导入教程 文档 讲解】基于springboot校园新闻管理系统源码和论文
  • 软考:系统架构设计师教材笔记(持续更新中)
  • win11永久修改pdf默认打开方式
  • 【Spring】配置文件的使用
  • Python 自动化 打开网站 填表登陆 例子
  • Github 2024-12-28 Rust开源项目日报 Top10
  • AIGC在电影与影视制作中的应用:提高创作效率与创意的无限可能
  • 简单园区网拓扑实验
  • Android OpenGl(二) Shader
  • 基于C#了解垃圾回收机制
  • Faster R-CNN
  • 【intellij idea 创建springBoot 搭配mybatis oracle】
  • C# 简单使用NModbus
  • 5.系统学习-PyTorch与多层感知机
  • JavaFX FXML模式下的布局
  • 尚硅谷Vue3入门到实战 —— 01 创建 VUe3工程
  • unity中Timeline动画的播放和播放中如何判断播放结束
  • springboot整合log4j2日志框架1
  • 25秋招面试总结
  • Kotlin快速入门
  • 惠州市政数局局长杨伟斌:惠州市公共数据授权运营模式探索
  • 雷池 WAF 搭配阿里云 CDN 使用教程
  • javaEE-多线程案例-单例模式
  • 深度学习:从原理到搭建基础模型
  • RabbitMQ HAProxy 负载均衡