当前位置: 首页 > article >正文

源码方式安装llama.cpp及调试

llama.cpp源码方式安装和调试配置

构建和编译

  • 注意这里是cuda,且要开启debug模式
cmake -B build -DGGML_CUDA=ON -DCMAKE_BUILD_TYPE=Debug
cmake --build build --config Debug
  • 正在编译:
    在这里插入图片描述

配置launch.json用于调式:

要根据自己的环境路径做相应修改

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "(gdb) 启动",
            "type": "cppdbg",
            "request": "launch",
            "program": "${workspaceFolder}/build/bin/llama-simple", // 
            "args": [    // 
                "-m", "output.gguf",
                "-n", "32",
                "-ngl", "99",
                "Hello my name is" 
            ],
            "stopAtEntry": false,
            "cwd": "${workspaceFolder}",
            "environment": [],
            "externalConsole": false,
            "MIMode": "gdb", // 
            "setupCommands": [
                {
                    "description": "为 gdb 启用整齐打印",
                    "text": "-enable-pretty-printing",
                    "ignoreFailures": true
                },
                {
                    "description": "将反汇编风格设置为 Intel",
                    "text": "-gdb-set disassembly-flavor intel",
                    "ignoreFailures": true
                }
            ],
            "miDebuggerPath": "/usr/bin/gdb" // 
        }

    ]
}

转换模型为gguf格式

python convert_hf_to_gguf.py --outtype f16 --outfile "output.gguf" "/raid/home/huafeng/models/Meta-Llama-3-8B-Instruct"

运行第一个程序

在这里插入图片描述

调试程序(llama.cpp/examples/simple/simple.cpp)

在这里插入图片描述


http://www.kler.cn/a/555673.html

相关文章:

  • 【爬虫基础】第一部分 网络通讯-Socket套接字 P2/3
  • 将 DeepSeek 接入 WPS 为办公提效 !
  • baby_web(WEB)
  • 算法模板(二分法开区间模板,二分法闭区间模板)
  • 京东cfe滑块 分析
  • 跟着柳叶刀数字健康,学习如何通过病理切片预测分子分类对预后的影响|项目复现
  • 【深度学习】矩阵的理解与应用
  • 网络通信 之综合布线(Integrated Cabling for Network Communication)
  • 栈和队列-前K个高频元素
  • Windows 图形显示驱动开发-上下文监视
  • Leetcode 76 Minimum Window Substring
  • 鸿蒙NEXT开发-应用数据持久化之关系型数据库
  • Microsoft 365 Copilot中使用人数最多的是哪些应用
  • MariaDB 历史版本下载地址 —— 筑梦之路
  • Java多线程深度解析
  • QT项目——天气预报
  • 南凌科技接入deepseek大模型,提升云网智安服务能力
  • CE RED 增加网络安全 添加新网络安全类型
  • [Android]如何判断当前APP是Debug还是Release环境?
  • Java+SpringBoot+Vue+数据可视化的航班购票出行服务平台(程序+论文+讲解+安装+调试+售后)