当前位置: 首页 > article >正文

先进制造aps专题二十五 openai的ai大模型设计也使用了aps用的并行遗传算法

openai的ai大模型设计是不是很神秘?

其实不神秘,看国内最新的一个团队招人

新型研究机构,AI团队招收ai大模型算子搜索、大模型训练与推理算法

ai大模型算子搜索:方向:算子辅助搜索工具的实现与开发、群体遗传算法研发、并行遗传算法研发,要求:Python/C++实现,优化、计算数学、遗传进化计算相关专业

ai大模型训练与推理算法:方向:LLM参数高效算法、幻觉抑制算法、反学习(unlearning)算法研发,要求:Pytorch深度学习/大模型训练经验,计算机、数学、EE相关专业


也就是ai大模型的算法模型研发就两块,一个就是模型的最优化算子设计,这要用并行遗传算法来搜索,不是靠人想,第二块就是训练的算法,前训练算法和后训练算法,这个靠人想

————

ibm一个做生产排程aps优化算法的,后来去openai搞ai大模型,估计就是干大模型算子搜素这个,用并行遗传算法搜索最佳的算子设计,比如几层,每层的参数(国内的免费生产排程软件isuperaps也是用并行遗传算法优化)

openai现在跑出来那么多核心员工,技术早就不保密了,估计这个团队就是按openai的模式搞

也就是说,openai的大模型的参数算子设计,其实也是并行遗传算法用超算搜索出来的

做法基本就是,先搞一个初始的算子设计,比如几层,每层多少参数,然后准备一个小规模的训练集,比如100g的训练集,和对应的测试集,先对初始算子的算法模型用100g的小规模训练集训练,测试集得分60分,然后对每个算子,用并行遗传算法搜素,对搜索出来的新算子的算法模型用100g的小规模训练集训练,测试集得分65分,这样反复的优化搜索,最后得到一个测试集得分最高的最优的算子

再对这个最优算子的算法模型,用15t 的大数据集训练,得到正式发布的模型(gpt3,gpt3.5,gpt4,gpt5)


http://www.kler.cn/a/282708.html

相关文章:

  • HarmonyOS Next 组件或页面之间的所有通信(传参)方法总结
  • redis7.x源码分析:(2) adlist双向链表
  • element plus的表格内容自动滚动
  • 【C++】—— map 与 set 深入浅出:设计原理与应用对比
  • 【数据结构】AVL树
  • 前端搭建低代码平台,微前端如何选型?
  • Linux文件IO缓存
  • Linux(更新中~)
  • 【JVM原理】类加载机制
  • hadoop文件上传步骤
  • Golang | Leetcode Golang题解之第382题链表随机节点
  • 正则表达式pattern
  • 【CSS】选择器
  • GAN Inversion(GAN 反演)
  • vue项目中解决el-table数据过多导致页面卡顿问题
  • 学习系列三:V8目标检测与分割自动化标注
  • 数据库不停机迁移方案
  • 【SpringCloud Alibaba】(九)学习 Gateway 服务网关
  • Golang 教程2
  • 工作 6 年,@Transactional 注解用的一塌糊涂
  • 空间计量 | 空间杜宾误差模型SDEM
  • 基于RK3568平台opencv的图像采集、ffmpeg推流和Windows端拉流(多线程)
  • 新手教学系列——如何实现基于asyncio的高效率 Worker(按需获取任务、防止阻塞与崩溃)
  • 时序预测 | 基于WTC+transformer时间序列组合预测模型(pytorch)
  • 【河北航空-注册安全分析报告-无验证方式导致安全隐患】
  • 图像处理领域的术语解析