当前位置: 首页 > article >正文

EleutherAI/pythia-70m

EleutherAI/pythia-70m” 是由 EleutherAI 开发的一个小型开源语言模型,它是 Pythia Scaling Suite 系列中参数量最小的模型,拥有大约 7000 万个参数。这个模型主要旨在促进对语言模型可解释性的研究;

Pythia Scaling Suite是为促进可解释性研究而开发的模型集合(见论文)。它包含两组八个模型,大小分别为 70M、160M、410M、1B、1.4B、2.8B、6.9B 和 12B。对于每种尺寸,都有两个模型:一个在 Pile 上训练,一个在数据集全局去重后在 Pile 上训练。所有 8 种模型大小都以完全相同的顺序在完全相同的数据上进行训练。我们还为每个模型提供 154 个中间检查点,作为分支托管在 Hugging Face 上。

Pythia 模型套件的设计初衷是促进大型语言模型的科学研究,尤其是可解释性研究。尽管没有将下游性能作为设计目标,但我们发现这些模型的性能与类似和相同大小的模型相当或超过它们,例如 OPT 和 GPT-Neo 套件中的模型。

【1】https://github.com/EleutherAI/pythia 

【2】https://huggingface.co/EleutherAI/pythia-70m


http://www.kler.cn/a/454530.html

相关文章:

  • 联通移动大内网如何使用plex流媒体服务器
  • 讲一个自己写的 excel 转 html 的 java 工具
  • 三只脚的电感是什么东西?
  • Unity2021.3.16f1可以正常打开,但是Unity2017.3.0f3却常常打开闪退或者Unity2017编辑器运行起来就闪退掉
  • 更改 pnpm 的全局存储位置
  • User Script Sandboxing作用 及 在iOS项目中获取GitCommitHash
  • MacOS安装Xcode(非App Store)
  • 2-197 基于matlab的生物地理学优化算法(BBO)在无人机三维航迹规划中的应用
  • Nature+Science=ONNs(光学神经网络)
  • html文件通过script标签引入外部js文件,但没正确加载的原因
  • 1_H5视频播放器-1 -- [前端开发之道:通过实例掌握编程思维]
  • Centos7配置webrtc-streamer环境
  • 识别后端返回的字符串中携带的空格 以及换行 要在前端展示 v-html
  • Python初识
  • MySQL从入门到入土---MySQL表的约束 (内含实践)---详细版
  • 火山引擎边缘云全面升级智能边缘,推动 AI 应用场景拓展与技术创新
  • K8s 常用资源介绍
  • clickhouse测试报告
  • Git如何设置和修改当前分支跟踪的上游分支
  • Ubuntu22.10/22.04 autoinstall--OK