当前位置: 首页 > article >正文

GLM-4-9B 是智谱 AI 推出的预训练模型 GLM-4 系列中的开源版本

根据glm4的项目介绍
GLM-4-9B 是智谱 AI 推出的预训练模型 GLM-4 系列中的开源版本。 在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出超越 Llama-3-8B 的卓越性能。除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。本代模型增加了多语言支持,支持包括日语,韩语,德语在内的 26 种语言。我们还推出了支持 1M 上下文长度(约 200 万中文字符)的 GLM-4-9B-Chat-1M 模型和基于 GLM-4-9B 的多模态模型 GLM-4V-9B。GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中,GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。
我制作了如下的流程图,支持大家对glm4的理解。

graph TD
    A["用户输入"] --> B["语义解析"]
    B --> C["任务分类"]
    C -- 数学 --> D["数学处理"]
    C -- 推理 --> E["推理处理"]
    C -- 代码 --> F["代码执行"]
    C -- 知识 --> G["知识查询"]
    C --> I["网页浏览"] & K["自定义工具调用"] & R["多语言支持"] & U["多模态 中英文综合能力"] & V["多模态 感知推理"] & W["多模态 文字识别"] & X["多模态 图表理解"]
    I --> J["获取网页数据"]
    K --> L["执行特定操作"]
    D --> N["指令构建器"]
    E --> N
    F --> N
    J --> N
    R --> S["支持26种语言"]
    G --> N
    L --> N
    N -- ≤128K token --> O["文本模态 GLM-4-9B"]
    N -- >128K token --> P["超长文本模态 GLM-4-9B-Chat-1M"]
    Q["多轮对话"] --> N
    U --> T["多模态 GLM-4V-9B"]
    V --> T
    W --> T
    X --> T
    T --> H["结果返回"]
    O --> H
    P --> H
    S --> N
    C --> Q




http://www.kler.cn/a/318817.html

相关文章:

  • ABC334
  • Kafka - 启用安全通信和认证机制_SSL + SASL
  • matlab建模入门指导
  • 大数据面试题--kafka夺命连环问(后10问)
  • 【贪心算法】No.1---贪心算法(1)
  • 【LeetCode】【算法】19. 删除链表的倒数第N个结点
  • Pytest-allure如何在测试完成后自动生成完整报告?
  • 占领矩阵-第15届蓝桥省赛Scratch中级组真题第5题
  • 桥梁轻量化结构监测系统解决方案
  • [OPEN SQL] SELECT语句
  • Android JNI 调用流程
  • 深入理解主键回显:提升数据操作效率与准确性
  • 目标检测系列(一)什么是目标检测
  • OpenMV与STM32通信
  • 稳了,搭建Docker国内源图文教程
  • Mysql梳理10——使用SQL99实现7中JOIN操作
  • C++ 面试模拟02
  • 2024 年最新 Protobuf 结构化数据序列化和反序列化详细教程
  • React Native 在 build 的时候如果出现 `babel.config.js` 配置文件的错误
  • 音频北斗定位系统有什么用?
  • C++入门编程题(力扣):字符串中最多数目的子序列
  • EasyExcel日常使用总结
  • 【C语言】使用 OpenSSL 进行 AES CBC 加密与解密
  • linux静态路由表
  • Nginx静态资源优化、压缩、缓存处理
  • 像百度谷歌这种网站会被DDoS吗