当前位置: 首页 > article >正文

Ollama - 简化使用本地大语言模型

学习完用 Transformers 和 llama.cpp 使用本地大语言模型后,再继续探索如何使用 Ollama 跑模型。Ollama 让运行和管理大语言模型变得更为简单,它构建在 llama.cpp 之上,并有优化,性能表现同样不俗。下面罗列一下它的特点

  1. 从它的 GitHub 项目 ollama/ollama, Go 语言代码 90.8%, C 代码 3.4%
  2. Ollama 不仅能运行 Llama 模型,还支持 Phi 3, Mistral, Gemma 2 及其他
  3. Ollama 支持 Linux, Windows, 和 macOS, 安装更简单,不用像 llama.cpp 那样需从源码进行编译,并且直接支持 GPU 的
  4. Ollama 有自己的模型仓库,无需申请访问权限,可从 Ollama 拉取所需模型,或 push 自己的模型到 Ollama 仓库pull llama3.2-vision
  5. Ollama 仓库的模型是量化过的,某个模型有大量的 tag 可选择下载,如 llama3.2 的 tags 有 1b, 3b, 3b-instruct-q3_K_M, 1b-instruct-q8_0, 3b-instruct-fp16 等
  6. 如果在 Ollama 上没有的模型,可以到 HuggingFace 上下载,或量化后再传到 Ollama 仓库

其他更多特性我们将在使用当中体验,仍然是在 i9-13900F + 64G 内存 + RTX 4090 + Ubuntu 22.4 台上进行 阅读全文 >>


http://www.kler.cn/a/412710.html

相关文章:

  • 若依框架部署在网站一个子目录下(/admin)问题(
  • 基于Python语言的Web爬虫设计源码
  • 【设计模式】【行为型模式(Behavioral Patterns)】之责任链模式(Chain of Responsibility Pattern)
  • 【八股文】小米
  • macos 14.0 Monoma 修改顶部菜单栏颜色
  • 【C语言】前端项目故障处理。
  • 双十一线上服务调用链路追踪SkyWalking实战分析
  • PostgreSQL表膨胀问题解析
  • python-docx -- 读取word页眉、页脚
  • 上海迪士尼奇幻冬日巡游:IP营销如何出圈?
  • wordpress拖拽式自定义文章排序插件Simple Custom Post Order,支持对wordpress文章、页面、自定义文章进行自定义排序
  • 通信与网络安全之IPSEC
  • [DL]深度学习_扩散模型正弦时间编码
  • 关于如何在k8s中搭建一个nsfw黄图鉴定模型
  • Spring |(四)IoC/DI配置管理第三方bean
  • NLP 2、机器学习简介
  • Dart 中 initializer lists
  • 【MySQL】自动刷新flush privileges命令
  • 【技术文档:技术传播的灯塔】
  • Python学习——猜拳小游戏
  • 组会 | 大语言模型 + LoRA
  • chrome允许http网站打开摄像头和麦克风
  • C++优质学习资源汇总
  • 【开源项目】ChinaAddressCrawler 中国行政区划数据(1980-2023年)采集及转换(Java版),含SQL格式及JSON格式
  • python+django自动化部署日志采用‌WebSocket前端实时展示
  • 第76期 | GPTSecurity周报