当前位置：首页 > article >正文

GLM-4-9B 是智谱 AI 推出的预训练模型 GLM-4 系列中的开源版本

article 2025/3/9 9:58:36

根据glm4的项目介绍
GLM-4-9B 是智谱 AI 推出的预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中， GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出超越 Llama-3-8B 的卓越性能。除了能进行多轮对话，GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用（Function Call）和长文本推理（支持最大 128K 上下文）等高级功能。本代模型增加了多语言支持，支持包括日语，韩语，德语在内的 26 种语言。我们还推出了支持 1M 上下文长度（约 200 万中文字符）的 GLM-4-9B-Chat-1M 模型和基于 GLM-4-9B 的多模态模型 GLM-4V-9B。GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力，在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中，GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。
我制作了如下的流程图，支持大家对glm4的理解。

graph TD
    A["用户输入"] --> B["语义解析"]
    B --> C["任务分类"]
    C -- 数学 --> D["数学处理"]
    C -- 推理 --> E["推理处理"]
    C -- 代码 --> F["代码执行"]
    C -- 知识 --> G["知识查询"]
    C --> I["网页浏览"] & K["自定义工具调用"] & R["多语言支持"] & U["多模态 中英文综合能力"] & V["多模态 感知推理"] & W["多模态 文字识别"] & X["多模态 图表理解"]
    I --> J["获取网页数据"]
    K --> L["执行特定操作"]
    D --> N["指令构建器"]
    E --> N
    F --> N
    J --> N
    R --> S["支持26种语言"]
    G --> N
    L --> N
    N -- ≤128K token --> O["文本模态 GLM-4-9B"]
    N -- &gt;128K token --> P["超长文本模态 GLM-4-9B-Chat-1M"]
    Q["多轮对话"] --> N
    U --> T["多模态 GLM-4V-9B"]
    V --> T
    W --> T
    X --> T
    T --> H["结果返回"]
    O --> H
    P --> H
    S --> N
    C --> Q

查看全文

http://www.kler.cn/a/318817.html