当前位置: 首页 > article >正文

Llama 3.1 大模型指令微调提升中文能力

一、前言

Llama 3.1 是一个通用的大型语言模型,尽管它在多种语言上进行了训练,但在某些特定语言(如中文)上的表现可能不如专门针对该语言进行优化的模型。通过指令微调,可以提高模型在处理中文文本时的理解和生成能力。对于某些领域(如医疗、法律、科技等),可能存在大量的中文专业术语和特定表达。通过指令微调,可以让模型更好地理解和生成这些领域的中文内容。通用大模型Llama 3.1 在中文评测数据集C-Eval、CMMLU 上表现不佳,通过指令微调可以针对特定任务进行优化,提升模型在这些任务上的性能。

二、实验

指令微调

在基础模型 meta-llama/Meta-Llama-3.1-8B-Instruct 上使用近310K 中文样本进行指令微调(Instruction Fine-tuning),进一步提升Llama 3.1 模型的中文理解与生成能力。指令微调方法选用LORA,可调参数选择all,指令微调数据集参考 Chinese-LLaMA-Alpaca-3


http://www.kler.cn/news/311074.html

相关文章:

  • 【系统架构设计师-2019年真题】案例分析-答案及详解
  • Scikit-learn 学习笔记
  • 尚品汇-秒杀商品存入缓存、Redis发布订阅实现状态位(五十一)
  • 全球首个!复旦大学冯建峰团队开发数字孪生脑平台,具备 860 亿神经元规模
  • 旷视轻量化网络shufflenet算法解读
  • MySQL——数据库的高级操作(二)用户管理(3)删除普通用户
  • 机器学习1--概述
  • Linux创建虚拟磁盘并分区格式化
  • 「Netmarble 小镇」活动来了:踏上穿越标志性世界的旅程!
  • OpenHarmony鸿蒙( Beta5.0)智能门铃开发实践
  • Unity-Transform-坐标转换
  • k8s环境下的相关操作
  • (SERIES12)DM性能优化
  • Bandicam简体中文版下载与安装百度网盘资源
  • 多路径文件批量下载工具V1.0.3-支持批量下载文件到单独文件夹的工具-供大家学习研究参考
  • 攻防世界——simple_php(NO.GFSJ0485)
  • pikachu下
  • JavaScript基础学习:预解析机制
  • 8-----手机机型维修工具助手 功能较全 涵盖解锁 刷机 修复等选项 维修推荐
  • dll注入的实现及session0注入
  • 编译器/工具链环境:GCC vs LLVM/Clang,MSVCRT vs UCRT
  • 继承1 2024_9_18
  • kafka之路-01从零搭建环境到SpringBoot集成
  • leetcode 四数相加||
  • PostgreSQL - SQL语句1
  • 系统在哪些情况下会触发缺页中断
  • oracle pkg正在跑如何停止
  • A review on rumour prediction and veracity assessment in online social network
  • ROM和RAM的区别
  • 简易CPU设计入门:本CPU项目的指令格式