当前位置: 首页 > article >正文

[论文笔记] megatron 大模型超参搜索pipeline

一、批量生成配比

# 保证element + "en"的总体占比不变
# 从element_min_ratio到element_max_ratio,生成element在这个范围内的超参搜索配比。
import pandas as pd
import numpy as np
pd.set_option('display.max_colwidth', None)

df = pd.read_csv("qwen2_data_ratio_lan17_dclm_code.csv", dtype={'dir': str, 'lang': str, 'size': float})
df_grouped = df.groupby(['lang']).sum().rename(columns={"size":"total_size"})
df_grouped.reset_index()

initial_lang = ['en','zh','es','fr','pt','ko','ja','tr','vi','th','ms','id','ar','it','de','pl','ur','sft','edu'

http://www.kler.cn/a/279938.html

相关文章:

  • 10款免费电脑录屏软件盘点,2024年最新录屏工具排行榜
  • 数据结构与算法——动态规划
  • 并行动力:用PyTorch在多GPU上释放深度学习潜能
  • UE5 蓝图 计算当前时间段
  • 大模型实战-FinGLM解析金融财报做RAG经验参考篇
  • Ado.Net基本操作
  • CSS属性
  • 命令模式在手游后端的应用
  • 云端Ruby:将应用无缝融入云服务的艺术
  • 除了tcp和udp以外的其他传输协议
  • 文档翻译软件哪个好用?这里有5个顶尖选择
  • 折腾 Quickwit,Rust 编写的分布式搜索引擎-官方教程
  • Spring Boot自定义注解
  • SQL进阶技巧:用户不同 WiFi 行为区间划分分析 | 断点分组问题
  • 磁盘挂载
  • 大模型面试八股,Offer拿到手软
  • 前沿重器[55] | prompt综述的解释和个人思考
  • FreeRTOS学习笔记>内存管理
  • 【Linux】——Rocky Linux配置静态IP
  • 微信小程序vue3父组件调用vue2子组件传多个参数方法