当前位置：首页 > article >正文

Llama3.1的部署与使用

article 2025/1/11 8:12:43

✨ Blog’s 主页: 白乐天_ξ( ✿＞◡❛)
🌈 个人Motto：他强任他强，清风拂山冈！
💫 欢迎来到我的学习笔记！

什么是Llama3.1？

Llama3.1 是 Meta（原 Facebook）公司开发的一款超大型语言模型。它的发布时间是在2024 年 7 月 23 日，模型系列包括 Llama3.1 8b、Llama3.1 70b 和 Llama3.1 405b。

性能与特点	详情
1. 处理能力提升	长文本处理能力增强，所有三款模型都具备改进的 128k 上下文长度，相比之前版本增加了 12 万个标记（token），模型容量是上一版本的 16 倍。多语言能力进步，提升了在英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等八种语言对话场景中的推理能力。
2. 语言理解与推理能力	更好地理解上下文，可从长篇文本中获取更多信息以做出更明智决策并生成更细致回应。强大的逻辑推理能力，能灵活把握语义关联，合理引申和过渡话题。
3. 运算及专业领域表现	在数学运算、工具使用等专业领域有不错表现，可精准进行复杂计算和操作。
4. 应用领域	内容生成，如故事、文章和诗歌等。聊天机器人与虚拟助手，增强对话能力。语言翻译，提供多语言即时高质量翻译。代码生成，协助开发人员。医疗与科研，辅助疾病预测和药物发现等。

下面我们开始学习部署 Llama3.1 的 8B 版本，该版本至少需要GPU显存16G。

本次部署的测试环境：

<font style="color:rgba(60, 60, 67, 0.78);">ubuntu 22.04 python 3.12 cuda 12.1 pytorch 2.4.0</font>

部署流程

创建实例

进入丹摩DAMODEL｜让AI开发更简单！算力租赁上丹摩！店家开始创建实例：

进入创建页面后，首先在实例配置中选择付费类型。一般短期需求可以选择按量付费或者包日，长期需求可以选择包月套餐；
其次选择GPU数量和需求的GPU型号，首次创建实例推荐选择：
1. 按量付费–GPU数量1–NVIDIA-GeForc-RTX-4090，该配置为60GB内存，24GB的显存（本次测试的LLaMA3.1 8B 版本至少需要GPU显存16G）
3. 4.
接下来配置数据硬盘的大小。每个实例默认附带了50GB的数据硬盘，首次创建可以就选择默认大小50GB。

注意： 如果您通过官方预制方式下载模型，建议扩容至60GB。

继续选择安装的镜像，选择PyTorch 2.4.0。

为保证安全登录，创建密钥对，输入自定义的名称，然后选择自动创建并将创建好的私钥保存的自己电脑中并将后缀改为.pem，以便后续本地连接使用。

创建好密钥对后，选择刚刚创建好的密钥对，并点击立即创建，等待一段时间后即可启动成功！

例如我创建的时“BaiLetian”。

点击立即创建：

登录实例

1. 等待实例创建成功，在 GPU云实例中查看实例信息：

JupyterLab 界面：

登录后一般会在 /root/workspace 目录下，服务器各个路径具体意义如下：
1. /：系统盘，替换镜像，重置系统时系统盘数据都会重置。
2. /root/workspace：数据盘，支持扩容，保存镜像时此处数据不会重置。
3. /root/shared-storage：共享文件存储，可跨实例存储。

SSH登录

SSH登录一般需要以下 4 个信息：

用户名：<font style="color:rgb(60, 60, 67);">root</font>；
远程主机域名或IP（这里使用host域名）：实例页面获取；
端口号：实例页面获取；
登录密码或密钥（这里使用密钥）：前面创建实例时保存到本地的密钥。

在实例页面获取主机host和端口号：

复制结果类似如下：

ssh -p 31729 root@gpu-s277r6fyqd.ssh.damodel.com
//gpu-s277r6fyqd.ssh.damodel.com 即主机host，31729 为端口号。

部署LLama3.1

1. 我们使用 `conda` 管理环境，DAMODEL示例已经默认安装了 `conda 24.5.0` ，直接创建环境即可：

conda create -n llama3 python=3.12

环境创建好后，使用如下命令切换到新创建的环境：

conda activate llama3

继续安装部署LLama3.1需要的依赖：

pip install langchain==0.1.15
pip install streamlit==1.36.0
pip install transformers==4.44.0
pip install accelerate==0.32.1

安装好后，下载 Llama-3.1-8B 模型，平台已预制Llama-3.1-8B-Instruct模型，执行以下命令即可内网高速下载：

wget http://file.s3/damodel-openfile/Llama3/Llama-3.1-8B-Instruct.tar

下载完成后解压缩/Llama-3.1-8B-Instruct.tar

tar -xf Llama-3.1-8B-Instruct.tar

查看全文

http://www.kler.cn/a/316136.html

机器学习无处不在，AI顺势而为，创新未来

鸿蒙UI（ArkUI-方舟UI框架）

Nacos概述与集群实战

USB 驱动开发 --- Gadget 设备连接 Windows 免驱

优化提示词改善答疑机器人回答质量

Wi-Fi Direct （P2P）原理及功能介绍

【齐家网-注册/登录安全分析报告】

微信小程序案例：比较数字大小（含代码）

鸿蒙4.0（HarmonyOS 4.0）与鸿蒙Next（HarmonyOS Next）区别

苹果macOS 15.0 Sequoia正式版发布：iPhone应用镜像玩、手机消息电脑知

医院信息化运维监控：确保医疗系统的稳定与安全

【C#生态园】从消息处理到可靠传输：探索.NET开发中不可或缺的六大库

计算机毕设设计推荐-基于python+Djanog大数据的电影数据可视化分析

CentOS上使用rpm离线安装Mosquitto(Linux上Mqtt协议调试工具)附资源下载

k8s下的网络通信与调度

苹果CMS插件：优化蜘蛛访问内容，提升百度收录率

供方软件供应链安全保障要求及开源场景对照自评表（下）

【JVM】类加载

玩转RabbitMQ声明队列交换机、消息转换器

用终端请求接口

[数据集][目标检测]手机识别检测数据集VOC+YOLO格式9997张1类别

283. 移动零

Linux：权限管理

mysql等保数据库命令

【动态规划】两个数组的 dp 问题二

828华为云征文 | 云服务器Flexus X实例：开源项目 LangChain 部署，实例测试