当前位置: 首页 > article >正文

模型和算力看板:Compute DashBoard

AGI 之路

AGI(通用人工智能)是整个计算机科学的圣杯,算力的增长和模型能力的提升(算法和数据)缺一不可。作为一个新质生产力,构建一个合理的评价体系是常用的方法论。针对模型和算力的评价,有类似MLPerf 这样的第三方评价组织, 但其数据主要依赖各个厂家进行提交,包含单机和服务器的各项指标,通常很难比较单一GPU或者单一模型的各项能力。

我们在选择云服务或者单机服务器时,基于现有模型如何匹配合适的算力,通常是一件糟心的事情,考虑到算力的昂贵,需要物尽其用,综合考虑现存/算力/带宽/散热 等影响因子。Compute DashBoard 从算力的角度出发,整理了各家国内外数据中心推理训练卡的各项参数,囊括了包含封装,互联以及算力指标等性能参数,可以为模型部署提供参考,同时如果你是一个芯片行业从业者,从产品角度,提供了一个竞品的功能和性能参考。

除此之外,Compute DashBoard 还提供了各个主流LLM开源模型在不同参数匹配情况下的Performance Benchmark, 包括首字延时/平均延时和吞吐。

使用指引

访问Compute DashBoard 网站:ostring.streamlit.app
在这里插入图片描述

进入主页后,Home 页是一个GPU Evolution 的Timeline 页面,希望呈现出各个阶段代表性的GPU 产品,AIGC 作为一个时代的Milestone, 产品也应该有它自己的Milestone,持续进化中。
在这里插入图片描述

GPUs 页面,我们可以选择芯片厂商,同时在对应的列表中选择支持的加速器产品
在这里插入图片描述

Models页面,目前支持市面上绝大多数开源的LLM模型,基于GPU 的性能数据,我们以柱状图的形式展示其在不同的GPU 平台上的延时和吞吐数据。

在这里插入图片描述

访问申请

Compute DashBoard 基于streamlit 作为开发框架快速搭建,基于streamlit community cloud进行部署。

  • step1: 登录streamlit cloud注册一个账号
    在这里插入图片描述

  • step2: 关注微信公众号OString2024或者CSDN OString2024,后台私信您的streamlit 账号(邮箱号:xxxx@xxx.com)
    在这里插入图片描述

  • step3: 博主在后台添加对应账号即可访问:ostring.streamlit.app

由于模型性能数据均由个人租用真实GPU来进行性能读出并整理至数据库,租用GPU会产生一定费用, 因此访问申请会逐渐放开,或者可以考虑Buy me a coffee,敬请了解。

期待

欢迎大家后台反馈你们的需求。
后续还会持续上线:

  • Diffusion/VIT 模型的benchmark;
  • 充实GPU 家族
  • 各厂家MLPerf 的性能结果

http://www.kler.cn/a/300953.html

相关文章:

  • LLM - 大模型 ScallingLaws 的 Causal/Masked (PLM) 目标系数差异 教程(2)
  • Flink链接Kafka
  • RabbitMQ的工作模式
  • 汽车免拆诊断案例 | 2007 款法拉利 599 GTB 车发动机故障灯异常点亮
  • 2025年中科院分区大类划分公布!新增8155本
  • LeetCode 热题 100_从前序与中序遍历序列构造二叉树(47_105_中等_C++)(二叉树;递归)
  • springboot实战学习(1)(开发模式与环境)
  • 深入解读Docker核心原理:Cgroups资源限制机制详解
  • 第12章 进入保护模式
  • UE5 Linux编译流程(实战)
  • Mybatis-设计模式总结
  • 【LeetCode 算法笔记】1. 两数之和
  • 基于SpringBoot+Vue+MySQL的实训管理系统
  • CCRC-DSA数据安全评估师:网络安全风险评估
  • js实现生成随机数值的数组
  • ChatGPT+Simple Mind Map生成思维导图:快速提升学习效率
  • Linux命令的补全和自动完成完全开启
  • 详细分析Mysql配置文件路径的查找(多种方法)
  • 用可道云teamOS的私密保险箱,构建职场人的安全小天地
  • 【容器安全系列Ⅵ】- Linux seccomp隔离
  • Java中的内存模型与并发编程优化
  • 核心系统用PG了,抠脑壳的权限,搞晕了!
  • 【软件合集】电脑桌面整理工具、DLL修复工具、文件加密等11款电脑必备软件,高效办公!
  • 多线程篇五——wait和notify
  • 现货黄金避险属性是怎么来的?
  • 敏捷开发方法例题