当前位置：首页 > article >正文

数字人本地部署之llama-本地推理模型

article 2025/3/17 7:06:12

llama 本地服务命令

llama-server.exe -m "data/LLM/my.gguf" --port 8080

-m 属于命令行选项，一般用来指定要加载的模型文件。

data/LLM/my.gguf 是模型文件的路径。gguf 格式的文件是一种用于存储语言模型权重的文件格式，服务器会加载这个文件里的模型权重，从而使用对应的语言模型开展任务。

--port 8080

--port 也是命令行选项，其作用是指定服务器要监听的端口号。

llama-server.exe --help

https://github.com/ggml-org/llama.cpp/releases

如何选择下载版本

cuda

cudart-llama-bin-win-cu11.7-x64.zip

未来商城—APPSTORE

superset部署记录

奇安信二面

7、标准库的string的常见使用

加固脱壳技术：DEX动态加载对抗

设计模式--单例模式(Singleton)【Go】

LLM自动化评测

WEB前端学习JAVA的一些建议