当前位置: 首页 > article >正文

Ollama Docker 镜像部署

文章来源:Docker 部署文档 -- Ollama 中文文档|Ollama官方文档

仅 CPU

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

英伟达 GPU

安装 NVIDIA Container Toolkit。

使用 Apt 安装
  1. 配置存储库

    curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey \
        | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
    curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
        | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' \
        | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
    sudo apt-get update
    
  2. 安装 NVIDIA Container Toolkit 软件包

    sudo apt-get install -y nvidia-container-toolkit
    
使用 Yum 或 Dnf 安装
  1. 配置存储库

    curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo \
        | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
    
  2. 安装 NVIDIA Container Toolkit 软件包

     sudo yum install -y nvidia-container-toolkit
    
配置 Docker 以使用 Nvidia 驱动程序
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
启动容器
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

[!NOTE]
如果您在 NVIDIA JetPack 系统上运行,Ollama 无法自动发现正确的 JetPack 版本。将环境变量 JETSON_JETPACK=5 或 JETSON_JETPACK=6 传递给容器以选择版本 5 或 6。

AMD 图形处理器

要使用带有 AMD GPU 的 Docker 运行 Ollama,请使用rocm标签和以下命令:

docker run -d --device /dev/kfd --device /dev/dri -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm

在本地运行模型

现在您可以运行模型:

docker exec -it ollama ollama run llama3.2

尝试不同的模型

更多模型可以在 Ollama 库中找到。

文章来源:Docker 部署文档 -- Ollama 中文文档|Ollama官方文档


http://www.kler.cn/a/556470.html

相关文章:

  • java(spring boot)实现向deepseek/GPT等模型的api发送请求/多轮对话(附源码)
  • 数据库-SQLite
  • 为什么docker 容器有的没有PORTS
  • 长尾关键词优化三步法:提升SEO搜索排名实战
  • Linux基础 -- 中断子系统之级联中断
  • 【问题】Qt c++ 因编码问题解析json失败
  • 多环境日志管理:使用Logback与Logstash集成实现高效日志处理
  • 《炒股养家心法.pdf》 kimi总结
  • 腾讯云开源Deepseek-V3与R1大模型API免费使用 + Chatbox本地化部署指南:从零到一的AI探索之旅
  • stm32单片机个人学习笔记16(SPI通信协议)
  • 论文解读 | AAAI'25 Cobra:多模态扩展的大型语言模型,以实现高效推理
  • ZLG嵌入式笔记 | 为什么你的网卡工作会不正常?(中)
  • Mysql测试连接失败
  • 【Day45 LeetCode】图论问题 Ⅲ
  • 为什么要用 const 和 let,而不是 var?
  • 使用 Docker 部署 Apache Spark 集群教程
  • 2025寒假天梯训练7
  • Python应用算法之贪心算法理解和实践
  • [Android] Battery Guru - 手机电量管理优化
  • 【愚公系列】《Python网络爬虫从入门到精通》022-Splash的爬虫应用