当前位置: 首页 > article >正文

【书生·浦语大模型实战营】学习笔记1

大模型成为发展通用人工智能的重要途经
专用模型:针对特定任务,一个模型解决一个问题
通用大模型:一个模型应对多种任务、多种模态
书生·浦语大模型系列
上海人工智能实验室
轻量级、中量级、重量级
7B 和 123B的轻量级和中量级大模型都是开源可用的

从模型到应用

应用类型:智能客服?个人助手?行业应用?
流程
image.png
这个过程中需要考虑的问题包括
· 模型选型——需要模型在哪些能力上比较强
· 业务场景——我们是否能够直接将模型应用到问题场景中
· 算力——采用不同的微调方式
· 交互问题——是否构建agent智能体来解决问题
· 模型评测——测试(微调后的)模型是否能解决问题
书生·浦语全链条开源开发体系
提供了包括数据、预训练、微调、评测和应用全方位的应用工具
image.png
数据
书生·万卷开源语料库:多模态融合、精细化处理、价值观对齐
openDataLab开放数据平台
预训练
高可扩展,多卡加速
极致性能优化,Hybrid Zero独特技术进行加速
兼容主流
主流的HuggingFace等技术生态
开箱即用
多种规格的预训练模型
微调
包括增量续训和有监督微调
增量续训:训练基座模型,学习到某个垂直领域的知识 数据为文章、书籍、代码等
有监督微调:让大模型理解各种指令,注入少量领域知识 数据为高质量对话、问答数据等
image.png

评测
国内外评测体系的整体态势
image.png

OpenCompass 评测平台
架构
image.png

部署
image.png

LMDeploy
提供大模型部署在GPU上的全流程解决方案,包括模型轻量化、推理和服务
image.png

智能体应用
大语言模型的局限性
image.png
使用大语言模型来驱动智能体
image.png

轻量级智能体框架Lagent
支持多种类型的智能体能力、多种大语言模型、扩展工具
image.png
实现让llm调用工具给用户提供更加复杂的服务

多模态智能体工具箱AgentLego
· 工具集合,包括视觉、多模态相关领域的前沿算法
· 多个主流智能体系统,如Lagent、LangChain、Transformers Agent等
· 多模态工具调用接口,支持各类input output工具函数
· 一键远程工具部署
image.png

参考资料

  1. 书生·浦语大模型全链路开源体系

http://www.kler.cn/news/234229.html

相关文章:

  • CSS3 基本语法
  • 17:定时器编程实战
  • 微软和苏黎世联邦理工学院开源SliceGPT创新压缩技术节省大量部署资源;OpenAI成立儿童安全团队,防AI误用
  • JavaScript的聚焦:focus/blur
  • Acwing 5469. 有效点对【正难则反+巧妙选择根节点】
  • Netty应用(四) 之 Reactor模型 零拷贝
  • 【算法】排序详解(快速排序,堆排序,归并排序,插入排序,希尔排序,选择排序,冒泡排序)
  • OpenCV-32 膨胀操作
  • 2024PMP考试新考纲-近年PMP真题练一练和很详细解析(3)
  • 【java】简单的Java语言控制台程序
  • golang select两个channel性能稳定,三个channel时性能会发生抖动,为什么?
  • (c语言版)数组去重和排序 题目描述: 给定一个乱序的数组,删除所有的重复元素,使得每个元素只出现一次,并且按照出现的次数从高到低
  • 设计模式-行为型模式(下)
  • 七、热身仪式(Warm-Up Rituals)
  • 《杨绛传:生活不易,保持优雅》读书摘录
  • Github 2024-02-10 开源项目日报Top10
  • Flink面试准备
  • 代码随想录算法训练营第三十三天丨[重看] 最大子数组、1143. 最长公共子序列/15.4 最长公共子序列
  • Android 识别车牌信息
  • Rust 格式化输出
  • TestNG基础教程
  • fast.ai 机器学习笔记(二)
  • JVM-类加载器 双亲委派机制
  • 项目02《游戏-13-开发》Unity3D
  • 在 Windows上恢复删除照片的 4 种有效方法
  • 初步探索Pyglet库:打造轻量级多媒体与游戏开发利器
  • 多维时序 | Matlab实现RF-Adaboost随机森林结合Adaboost多变量时间序列预测
  • hexo 博客搭建以及踩雷总结
  • 面向对象编程:理解其核心概念与应用
  • linux上部署ftp服务