当前位置: 首页 > article >正文

LLM之Agent(三):HuggingGPT根据用户需求自动调用Huggingface合适的模型

​       浙大和微软亚洲研究院开源的HuggingGPT,又名JARVIS,它可以根据用户的自然语言描述的需求就可以自动分析需要哪些AI模型,然后去Huggingface上直接调用对应的模型,最终给出用户的解决方案。

一、HuggingGPT的工作流程

       它的工作流程包括四个阶段:

  • 任务规划:ChatGPT将用户的需求解析为任务列表,并确定任务之间的执行顺序和资源依赖关系;

  • 模型选择:ChatGPT根据HuggingFace上托管的各专家模型的描述,为任务分配合适的模型;

  • 任务执行:混合端点(包括本地推理和HuggingFace推理)上被选定的专家模型根据任务顺序和依赖关系执行分配的任务,并将执行信息和结果给到ChatGPT;

  • 响应生成:最后,由ChatGPT总结各模型的执行过程日志和推理结果,给出最终的输出。

下表展示了HuggingGPT的具体细节:

不同任务的任务规划评估,如下表所示:

         任务规划的格式是: [{"task": task, "id", task_id, "dep": dependency_task_ids, "args": {"text": text, "image": URL, "audio": URL, "video": URL}}],参数的详细解释,如下表所示:

二、HuggingGPT的示例

      假设我们有如下请求,来看一下HuggingGPT的完整流程:

       请求:请生成一个女孩正在看书的图片,她的姿势与example.jpg中的男孩相同。然后请用你的声音描述新图片。

       可以看到HuggingGPT是如何将它拆解为6个子任务,并分别选定模型执行得到最终结果的。

HuggingGPT不同任务的实验效果

参考文献:

[1] https://github.com/microsoft/JARVIS

[2] https://huggingface.co/spaces/microsoft/HuggingGPT

[3] https://arxiv.org/abs/2303.17580

[4] https://twitter.com/DrJimFan/status/1642563455298473986


http://www.kler.cn/news/157429.html

相关文章:

  • 数据库系统概论期末经典大题讲解(用关系代数进行查询)
  • 前端 --- HTML
  • 【设计模式-4.3】行为型——责任链模式
  • Hive安装与配置
  • webpack打包体积优化,减少白屏时间
  • ARM与大模型,狭路相逢
  • 探索人工智能领域——每日20个名词详解【day6】
  • 关于近期互联网行业收缩的一些看法
  • 关于rocketMQ踩坑的那些事
  • 【hacker送书第8期】Java从入门到精通(第7版)
  • Unity Meta Quest 一体机开发(八):【手势追踪】实现 Hand Grab 扔物体功能
  • Kotlin学习之04
  • 时间序列预测实战(二十三)进阶版LSTM多元和单元预测(课程设计毕业设计首选)
  • 【初阶解法-数据结构】包含min函数的栈(代码+图示)
  • 熬夜会秃头——beta冲刺Day7
  • 【开源】基于Vue.js的河南软件客服系统
  • 【Node-RED】http response收发实现
  • Shell数组函数:数组(一)
  • 如何制作教育培训小程序
  • 数字孪生是什么,是干什么用的?
  • 01 高等数学.武忠祥.0基础
  • 考虑光伏发电的配电网重构策略研究
  • 一次elasticsearch 查询瞬间超时案例分析
  • GEE:使用Roberts算子卷积核进行图像卷积操作
  • 【C语言】深入理解C语言中的数学运算和类型转换
  • Unity中C#使用协程控制Shader材质变化
  • unity3d模型中缺失animation
  • docker (镜像分层、阿里云镜像推送/拉去)-day02
  • Kontakt v7.7.2(音频采样器)
  • Golang实践录:读取xml配置文件