当前位置: 首页 > article >正文

数据集的选取、标注

数据集

下图为数据处理的一般流程,来自于:跟李沐学AI
在这里插入图片描述
数据集有不同的类型,例如图像、文本、二进制、文件夹等等格式
文本文件:CSV、TSV、Json、Txt
二进制文件:npy
图片文件:jpg、jpeg、png等

公共数据集

1.papers with code
人工智能方向研究生的必备网站
在这里插入图片描述
如何使用的参考文章:papers with code介绍(人工智能方向研究生的必备网站)

2.kaggle datasets
在这里插入图片描述
下载参考文章:从kaggle上下载数据集方法

3.huggingface
在这里插入图片描述

也可以称作抱抱脸,快速入门文章推荐:Hugging Face快速入门

4.Google Dataset Search
在这里插入图片描述
推荐配合Google Colab使用:Google Colab 无敌详细使用教程

数据的标注

标注过程大致分为三种情况:
1.足够多的标注
2.足够多的钱
3.缺少以上两种

数据标注是一个对原始数据进行标记和分类的过程,使其可用于训练ML模型。

数据标注有助于将原始数据转化为ML算法可以理解和学习的结构化格式。通过为数据提供背景和意义,标注过的数据可以作为训练ML模型的基础,以识别模式,进行预测,并执行各种任务。

图像标注参考示例文章:【数据标注】数据集标注规范与常见情况

常见图像标注分类:十种常见的图像标注方法 | 数据标注


http://www.kler.cn/news/314470.html

相关文章:

  • POS共识机制简介
  • 从0到1训练私有大模型技能与应用实现 ,企业急迫需求,抢占市场先机
  • LabVIEW提高开发效率技巧----采用并行任务提高性能
  • Qt优秀开源项目之二十三:QSimpleUpdater
  • 地面站通过SSH连接无人机
  • Vue3中监听器watchEffect的使用
  • Vue使用axios二次封装、解决跨域问题
  • 【go/方法记录】cgo静态库编译以及使用dlv定位cgo崩溃问题
  • 《娱乐至死》
  • BERT模型解读与简单任务实现(论文复现)
  • ChatGPT搭上langchain的知识库RAG应用,效果超预期
  • Vue.js 与 Flask/Django 后端的高效配合指南
  • 动态线程池(五)
  • 【ESP32】ESP-IDF开发 | UART通用异步收发传输器+串口收发例程
  • 深度学习-图像处理篇1.3pytorch神经网络例子
  • 【数据仓库】数据仓库层次化设计
  • vue3(整合版)
  • docker入门总结(附错误处理,持续更新)
  • 如何使用 Python 的 sqlite3 模块操作 SQLite 数据库?
  • mac命令行分卷压缩与合并
  • 长列表加载性能优化
  • python画图1
  • springboot实战学习(6)(用户模块的登录认证)(初识令牌)(JWT)
  • python:给1个整数,你怎么判断是否等于2的幂次方?
  • java.nio.ByteBuffer的 capacity, limit, position, mark
  • 如何打造高效的远程开发团队:最佳实践与挑战
  • 大话C++:第11篇 类的定义与封装
  • Redis——redispluspls库通用命令以及String类型相关接口使用
  • 每日一题--打印闰年
  • 如何使用 Python 连接 MySQL 数据库?什么是 ORM(对象关系映射),如何使用