当前位置: 首页 > article >正文

241130_MindNLP学习记录

241130_MindNLP学习记录

首先我们需要搞清楚MindNLP是什么

MindNLP是一个自然语言处理的开源库,包含了很多自然语言处理的常用方法以及很多模型

首先datasets方面,使用pytorch加载数据时是数据集全量加载到内存里,全部进行遍历并预处理,然后才进行打包batch,然后循环返回batch。

而MindNLP这边,他是每次按需取,我这个batch只需要batch size条数据,我就只拿batch size 条数据,然后进行遍历预处理,再返回batch。

在MindNLP上可以直接使用huggingface的模型以及pytorch的模型。

pytorch的模型文件(.bin,.pth,.safetensor)都是可以直接载入的,不需要做convert模型转换。

MindNLP可以支持国内多个镜像站的模型下载

MindSpore在昇腾卡上实际训练的精度会比pytorch在GPU上训练得到的精度高0.1%到1.0%,可以借此做一些微调之类的工作,比较好出成果。

通过一系列的优化手段,在910A上跑Llama 7b的模型,推理一个token的时间可以从330ms缩短到65ms。

分布式推理可以通过设置device_map来自动分配到每张卡上来推理。

推出Megatron的MindSpore版本。


http://www.kler.cn/a/417438.html

相关文章:

  • Spring Task之Cron表达式
  • “卫星-无人机-地面”遥感数据快速使用及地物含量计算的实现方法
  • 区块链项目孵化与包装设计:从概念到市场的全流程指南
  • 使用多模态大语言模型进行深度学习的图像、文本和语音数据增强
  • Postgresql的三种备份方式_postgresql备份
  • python:csv文件批量导入mysql
  • 【大语言模型】ACL2024论文-22 大型语言模型中的自信心:探究大型语言模型生成回答的自信心与概率一致性
  • C_字符串的一些函数
  • 算法编程题-颜色交替的最短路径
  • Vue.js 组件开发:进阶技巧与最佳实践
  • pytest 通过实例讲清单元测试、集成测试、测试覆盖率
  • 网络安全开发包介绍
  • Qt问题之 “QWidget: Must construct a QApplication before a QWidget“错误
  • 700M是什么?为什么被称为黄金频段?
  • gitee:解决vs文件权限被拒问题
  • 数据结构(初阶7)---七大排序法(堆排序,快速排序,归并排序,希尔排序,冒泡排序,选择排序,插入排序)(详解)
  • 华为小米苹果三星移动设备访问windows共享文件夹windows11
  • Three.js 相机视角的平滑过渡与点击模型切换视角
  • 新型大语言模型的预训练与后训练范式,谷歌的Gemma 2语言模型
  • Wireshark常用功能使用说明
  • 【NLP 1、人工智能与NLP简介】
  • Python 简单的网页服务器
  • LINQ (C#) 中的限定符运算:全部All、任意Any、包含Contains
  • Ajax、Fetch、Axios、XMLHttpRequest 的关系与区别
  • Python应用实战--制作网络稳定性监控自动化脚本
  • 电商项目--分布式文件存储FastDFS搭建