当前位置：首页 > article >正文

大语言模型---Llama不同系列的权重参数文件提取；Llama-7B权重文件提取；Llama-8B权重文件提取；主要代码功能解析

article 2025/2/21 3:48:45

文章目录

1. 概要
2. Llama-7B权重文件提取
3. Llama-8B权重文件提取
4. 主要代码功能解析

1. 概要

Llama 系列模型（Meta 发布的大语言模型）在开源社区广受欢迎，不同版本（前文已经介绍过7B和8B的区别，详情请点击链接）在应用场景和硬件需求上各有不同，其权重文件的提取方式也略有差异。本文将通过代码讲解如何获取和提取 Llama 7B 和 8B 的权重参数文件。

2. Llama-7B权重文件提取

from transformers import AutoTokenizer, AutoModelForCausalLM

def save_weight_int(int_weight: torch.Tensor, path):
    if path[-4:] != '.bin':
        raise ValueError('Path must end with .bin')
    int_weight.cpu().detach().numpy().astype(np.int32).tofile(path)

if __name__ == '__main__':

	tokenizer = AutoTokenizer.from_pretrained(model_card, local_files_only = True, cache_dir = "./model-storage")
    model = AutoModelForSequenceClassification.from_pretrained(model_card, local_files_only = True, cache_dir = "./model-storage")

	for (i, w) in model.model.layers[0].named_parameters():
	    if len(w.shape) == 2:
	        pp_size = w.shape[0]
	        pp_size <<= args.log_off_factor  # 位移操作
	    elif len(w.shape) == 1:
	        (pp_size,) = w.shape
	    else:
	        raise ValueError(f"Unexpected shape {w.shape} for parameter {i}")
        print(f"Layer {i}, Parameter {j}, Shape: {w_orig.shape}")
        save_weight_int(w_orig, f"./zkllm-workdir/Llama-2-{args.model_size}b/layer-{i}-{j}-int.bin")

3. Llama-8B权重文件提取

from transformers import AutoTokenizer, AutoModelForCausalLM

def save_weight_int(int_weight: torch.Tensor, path):
    if path[-4:] != '.bin':
        raise ValueError('Path must end with .bin')
    int_weight.cpu().detach().numpy().astype(np.int32).tofile(path)

if __name__ == '__main__':
	for i, layer in enumerate(model.model.layers):
	    for j, w in layer.named_parameters():
	        # 中间层参数的处理
	        if len(w.shape) == 2:
	            w_orig = w.float().T
	        else:
	            w_orig = w.float()
	        print(f"Layer {i}, Parameter {j}, Shape: {w_orig.shape}")
	        save_weight_int(w_orig, f"./zkllm-workdir/Llama-2-{args.model_size}b/layer-{i}-{j}-int.bin")
	
	# 处理顶层参数（如输出层的 score.weight）
	for name, param in model.named_parameters():
	    if "score.weight" in name:  # 仅处理输出权重
	        if len(param.shape) == 2:
	            w_orig = param.float().T
	        else:
	            w_orig = param.float()
	        print(f"Processing Output Layer Parameter {name}, Shape: {w_orig.shape}")
	        save_weight_int(w_orig, f"./zkllm-workdir/Llama-2-{args.model_size}b/{name.replace('.', '-')}-int.bin")

4. 主要代码功能解析

save_weight_int(int_weight: torch.Tensor, path) 函数
作用：将权重量化为 int32 数据，并以 .bin 格式保存到指定路径。
遍历 model.model.layers 的所有参数

for i, layer in enumerate(model.model.layers):
    for j, w in layer.named_parameters():

遍历模型的每一层（model.model.layers），i是层索引，layer 是每一层的模块。
使用 named_parameters() 遍历每层中的所有参数（权重和偏置）。
- j 是参数名称（例如 self_attn.q_proj.weight）。
- w 是参数张量

中间参数处理（可以去掉）

if len(param.shape) == 2:
	w_orig = param.float().T
else:
	w_orig = param.float()

查看全文

http://www.kler.cn/a/411633.html

（已解决）wps无法加载此加载项程序mathpage.wll

音视频技术扫盲之预测编码的基本原理探究

基于Matlab扩展卡尔曼滤波的主从导航系统传递对准仿真与优化研究

SpringBoot（三十九）SpringBoot集成RabbitMQ实现流量削峰添谷

Oracle 深入学习 Part 9: Storage Structure and Relationships（存储结构与关系）

音视频相关的一些基本概念

前后端分离，后端拦截器无法获得前端请求的token

快速理解微服务中Ribbon的概念

01.Django快速入门

Redis核心类型----有序集合

案例分析：嵌入式边缘计算机ARMxy在工商储能柜新能源应用

租赁小程序|租赁系统搭建|租赁系统需求

React-useState的使用

redmi 12c 刷机

【Linux】vim的使用

cuda conda yolov11 环境搭建

SSM框架整合

C#中面试的常见问题003

11.19c++面向对象+单例模式

jupyter notebook的 markdown相关技巧

文章目录

1. 概要

2. Llama-7B权重文件提取

3. Llama-8B权重文件提取

4. 主要代码功能解析

相关文章：