当前位置: 首页 > article >正文

[论文笔记] eval-big-refactor lm_eval 每两个任务使用一个gpu,并保证端口未被使用

1.5B在eval时候两个任务一个gpu是可以的。

7B+在eval belebele时会OOM,所以分配时脚本不同。

eval_fast.py:

import subprocess
import argparse
import os
import socket

# 参数列表
task_name_list = [
    "flores_mt_en_to_id",
    "flores_mt_en_to_vi",
    "flores_mt_en_to_th",
    "flores_mt_en_to_ms",
    "flores_mt_id_to_en",
    "flores_mt_vi_to_en",
    "flores_mt_th_to_en",
    "flores_mt_ms_to_en",
    "ceval",
    "mmlu",
    "arc_challenge",
    "arc_easy",
    "hellaswag",
    "belebele",
]

# 解析命令行参数
parser = argparse.ArgumentParser(description="Run evaluation")
parser.add_argument("--model_names", type=

http://www.kler.cn/a/281890.html

相关文章:

  • 信息与决策支持系统(Information and Decision Support Systems,IDSS)
  • 【FAQ】HarmonyOS SDK 闭源开放能力 —Share Kit
  • web——upload-labs——第十二关——%00截断
  • 每日一练 | 包过滤防火墙的工作原理
  • Java——并发工具类库线程安全问题
  • MySQL的编程语言
  • 网络爬虫--生成假数据
  • uniapp icons图标不显示的问题解决
  • Python爬虫(一文通)
  • Leetcode 131.分割回文串 回溯 C++实现
  • 淘宝扭蛋机小程序,市场发展下的潜在机遇
  • Vue(三)内置指令v-text、html、cloak、once、pre;自定义指令的三种方式、Vue生命周期
  • 如何切换当前使用的IP代理协议
  • 【网络安全】服务基础第一阶段——第二节:Windows系统管理基础----虚拟化IP地址以及用户与组管理
  • 一起搭WPF之列表界面设计
  • [每日一练]查询结果的质量和占比(布尔值的灵活使用)
  • 猫咪掉毛如何清理?希喂、范罗士宠物空气净化器性能比拼
  • 嵌入式UI开发-lvgl+wsl2+vscode系列:11、SSD202移植运行评估demo程序
  • vue ref和reactive区别
  • 在发布您的插件之前,如何在 ONLYOFFICE 插件市场中进行测试?
  • 如何在Java爬虫中设置代理IP:详解与技巧
  • python使用多进程multiprocessing
  • Python运行时环境
  • 小程序自定义组件配合插槽和组件传值
  • C语言中的野指针
  • 深度强化学习算法(二)(附带MATLAB程序)