llm知识梳理
前一阵子梳理llm的时候总是在纸上写下来,现在发现有一些还是需要上点图的,谨此文章记录学习过程,有说错的地方可以指出~
网络结构
优化方式
多样化生成
CoT
CoT 的发展方向有三条主要的路径,分别是 “Prompt 模式”,“推理结构”以及“应用场景”
Prompt 模式
ActivePrompt:半人工生产,从数据集里面挑选出多个回答差异最明显的问题,进行此类问题的人工标注。(论文中叫【不确定度度量】)
Auto-CoT:
1. 将给定数据集中的问题聚为不同的簇(kmeans)
2. 从每个簇中选择代表性的问题,通过Zero-Shot-CoT的方式生成reasoning chain。(都使用lets think step by step,并且选择时采用简单的启发是规则,例如最短的等)
3. 作为prompt,一起输入到llm中,变成一个fewshot learning
推理结构
其实就是将COT用不同的方式表达
应用场景
多模态
第一篇多模态:MM-CoT,主要就是通过视觉特征来生成思维链,得到最后的结果。