当前位置: 首页 > article >正文

大语言模型数据类型与环境安装(llama3模型)

文章目录

  • 前言
  • 一、代码获取
  • 一、环境安装
  • 二、大语言模型数据类型
    • 1、基本文本指令数据类型
    • 2、数学指令数据类型
    • 3、几何图形指令数据类型
    • 4、多模态指令数据类型
    • 5、翻译指令数据类型
  • 三、vscode配置
  • 四、相关知识内容
    • 1、理解softmax内容
    • 2、torch相关函数
      • nn.Embedding函数
      • torch.nn.functional.scaled_dot_product_attention
      • torch.multinomial函数
  • 五、llama3相关内容说明
    • 1、llama3的权重文件夹
    • 2、模型文件对比
  • 六、huggingface相关内容
    • 1、huggingface的generate方法
    • 2、tokenizer.decode(s, skip_special_tokens=True)方法

前言

简单给出环境安装与数据类型及vscode运行配置,其中vscode运行配置是便于我们调试代码。

一、代码获取

llama3的代码非常好下载,但是获取权重难度较大,而我这个教程也是为了解读大语言模型内容。为此,我找了一个github开源好下载权重的代码做为基准研究,其网址:https://github.com/WJC262/Chinese-LLaMA-Alpaca-3-main。其内容形式如下图显示:

在这里插入图片描述

你可放心使用,我已训练一个数学模型,效果还是不错的!

一、环境安装

我讲解有2个代码,一个是github提供,一个是我通过transformer构建的llama架构,而环境安装是非常简单的,只需cd到相应文件夹路径,直接下面一句话,可实现环境安装,如下:

pip install -

http://www.kler.cn/news/364581.html

相关文章:

  • 关于希尔排序的理解
  • 一个vue3的待办列表组件
  • 【32】C++流
  • LeetCode Hot 100:图论
  • 一招教你解决Facebook广告账号问题
  • 无人机避障——路径规划篇(一) JPS跳点搜索算法A*算法对比
  • 【vuejs】富文本框输入的字符串按规则解析填充表单
  • [C++进阶数据结构]红黑树(半成品)
  • oneplus3t-android_framework
  • 中间件-概念
  • 高翔【自动驾驶与机器人中的SLAM技术】学习笔记(十二)拓展图优化库g2o(一)框架
  • 3种方法,教你用Pytest更改自动化测试用例执行顺序
  • 192×144像素是几寸照片?如何手机拍照制作
  • 【python实操】python小程序之参数化以及Assert(断言)
  • General Purpose I/O Ports and Peripheral I/O Lines (Ports)
  • JVM成神之路
  • 测试学习-测试分类
  • Spring Boot框架中小企业设备监控系统开发
  • c++中虚函数表属于类还是属于对象?
  • Ubuntu20.04 更新Nvidia驱动 + 安装CUDA12.1 + cudnn8.9.7
  • 【数据结构与算法】力扣 46. 全排列
  • 中国人寿财险青岛市分公司引领科技金融新风尚
  • HarmonyOS 5.0应用开发——应用打包HAP、HAR、HSP
  • 新160个crackme - 082-phox.1
  • Elasticsearch在分布式集群中进行数据分片的策略能否完全避免数据热点?数据分片分布不均会导致性能瓶颈吗?如何通过实践优化分片分布?
  • 本地生活平台开发搭建方案 同城O2O电商平台推广运营