当前位置: 首页 > article >正文

微软:GPT-4o-mini只有8B,o1-mini仅100B

关于主流闭源LLM的参数规模一直讨论不断,在2024年最后2天来自微软的一篇关于检测和纠正临床笔记中医疗错误的测试基准MEDEC的研究一不小心直接漏了它们的参数规模:o1-preview, GPT-4,GPT-4o和Claude 3.5 Sonnet。

图片

  1. Claude 3.5 Sonnet(2024-10-22),~175B

  2. ChatGPT,~175B

  3. GPT-4,约1.76T

  4. GPT-4o,~200B

  5. GPT-4o-mini(gpt-4o-2024-05-13)只有8B

  6. 最新的o1-mini(o1-mini-2024-09-12)仅100B

  7. o1-preview(o1-preview-2024-09-12)~300B

图片

实验部分也是将大模型参数规模分为3挡:7-8B,~100-300B,~1.7T,而GPT-4o-mini被分在第一档,只有8B着实让人有点不可思议~

 PromptWizard 概述

图片

https://arxiv.org/pdf/2412.19260v1MEDEC: A BENCHMARK FOR MEDICAL ERROR DETECTION AND CORRECTION IN CLINICAL NOTES

来源 | PaperAgent

赞赏二维码


http://www.kler.cn/a/472097.html

相关文章:

  • Synthesia技术浅析(五):计算机视觉
  • 【人工智能-概念篇】迁移学习、多任务学习与多模态学习:深度解析与应用探讨
  • 无人机航测(航空摄影测量)技术详解
  • 数据库高安全—角色权限:权限管理权限检查
  • 【项目实战1】五子棋游戏
  • Kubernetes Gateway API-5-后端协议和网关基础设置标签
  • idea 修改项目参数, 不修改application.yaml文件
  • 解决“KEIL5软件模拟仿真无法打印浮点数”之问题
  • STM32——系统滴答定时器(SysTick寄存器详解)
  • Go语言性能优化-字符串格式化优化
  • Java-数据结构-顺序表(ArrayList)
  • 2025 年热门AI 应用——AI 编程会如何发展?
  • SSH(Secure Shell) 网络协议
  • 望获实时Linux系统与大语言模型深度融合,开创实时智能无限可能!
  • Unreal Engine 5 C++ Advanced Action RPG 五章笔记
  • Python爬虫与1688图片搜索API接口:深度解析与显著收益
  • NodeLocal DNS 全攻略:从原理到应用实践
  • 【HTML】Day02
  • 从零手写实现redis(四)添加监听器
  • 30天开发操作系统 第 12 天 -- 定时器