当前位置：首页 > article >正文

【langchain/入门】使用langchain调用本地部署的大模型(以llama.cpp以及ollama为例)

article 2025/3/13 2:55:09

文章目录

说在前面
ollama(qwen2.5-coder:7b)
- 部署模型
- 使用langchain
llama.cpp(deepseek-r1:1.5b)
- 模型部署
- 使用langchain

说在前面

操作系统：windows
python版本：3.9
langchain版本：0.3.20
pycharm版本：2023.1.2 (Community Edition)
ollama版本：0.5.4
llama.cpp版本：b4870

ollama(qwen2.5-coder:7b)

部署模型

ollama部署大模型比较简单，到官网下载安装包后安装
根据自己电脑的条件选择合适的模型，比如
然后打开命令行，执行
```
ollama run qwen2.5-coder
```

然后就可以直接在命令行对话了

$ ollama run qwen2.5-coder:latest
>>> 你好
你好！有什么我可以帮忙的吗？

>>> Send a message (/? for help)

使用langchain

langchain提供了直接调用ollama api的package，安装后直接使用即可
```
pip install langchain-ollama
```

代码环节

from langchain_ollama import OllamaLLM

ollm = OllamaLLM(model="qwen2.5-coder:latest")
print(ollm.invoke("你好"))

运行

(venv) PS D:\Code\langchain> python .\main.py
你好！有什么我可以帮忙的吗？

llama.cpp(deepseek-r1:1.5b)

模型部署

算力不足，搞个1.5b测试吧
llama.cpp部署也挺简单的，到github选择合适的版本
x64-windows-nvdia gpu
下载cudart-llama-bin-win-cuxx.x-x64.zip以及llama-b4870-bin-win-cuda-cuxx.x-x64.zip，其中cudart是cuda相关的依赖，解压后将里面的文件放到llama...zip解压后的同级目录即可
例如
mac-m4
下载llama-b4870-bin-macos-arm64.zip解压即可

使用llama-client即可在命令行下进行交互，例如

./llama-cli -m DeepSeek-R1-Distill-Qwen-1.5B-Q4_K_M.gguf
> 你好
<think>

</think>
你好！很高兴见到你，有什么我可以帮忙的吗？无论是聊天、解答问题还是提供建议，我都在这里为你服务。😊

如果需要让langchain能够使用，需要部署服务，即使用llama-server

./llama-sever -m DeepSeek-R1-Distill-Qwen-1.5B-Q4_K_M.gguf --port 50052 --host 0.0.0.0 -c 2048

使用langchain

llama.cpp部署的服务使用的API格式是与openai兼容的，所以在langchain中，我们可以使用openai对应的package
```
pip install langchain-openai
```

代码环节

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(max_tokens=None,
                 timeout=None,
                 openai_api_base="http://127.0.0.1:50052",
                 openai_api_key="none")
# openai_api_base 就是llama-server 部署时监听的地址
# openai_api_key 必须要填 随便填就行 不能为 ""
print(llm.invoke("你好").content)

运行

(venv) PS D:\Code\langchain> python .\main.py
<think>

</think>

你好！很高兴见到你，有什么我可以帮忙的吗？无论是聊天、解答问题还是提供建议，我都在这里为你服务。😊

查看全文

http://www.kler.cn/a/582182.html

excel的导入和下载（poi）

强化科技内核 “人工智能+”助力农业新质生产力飞跃

Hexo博客Icarus主题不蒜子 UV、PV 统计数据初始化配置

LVTTL（Low Voltage Transistor-Transistor Logic）电平详解

K8S中MySQL配置持久化存储

Go 语言入门指南

OPPO手机怎么录制屏幕？屏幕录制软件分享

comctl32!ListView_OnSetItem函数分析LISTSUBITEM结构中的image表示图标位置

开源模型时代的 AI 开发革命：Dify 技术深度解析

Node 使用 SSE 结合redis 推送数据(echarts 图表实时更新)

springboot3 spring security+jwt实现接口权限验证实现

牛客周赛:84:B:JAVA

亚信安全发布第七期《勒索家族和勒索事件监控报告》

Vue3实战学习（Element-Plus常用组件的使用(轮播图、日期时间选择器、表格、分页组件、对话框)(超详细)）(下)(6)

设计模式之工厂模式：原理、实现与应用

模拟面试题：系统设计

Spring（九）AOP-底层原理与通知方法的理解

SQL Server 与 MySQL 的库同步工具推荐

《React 属性与状态江湖：从验证到表单受控的实战探险》

【从零开始学习计算机科学】计算机体系结构（二）指令级并行（ILP）

文章目录

说在前面

ollama(qwen2.5-coder:7b)

部署模型

使用langchain

llama.cpp(deepseek-r1:1.5b)

模型部署

使用langchain

相关文章：