计算机视觉--图像数据分析基本操作
计算机视觉–图像数据分析基本操作
- 数据集大小、图像尺寸、通道顺序及通道数、分辨率、像素值范围(极大极小平均值)、像素值的存储类型(float32、uint8、uint16)
- 对于特定模态的数据,分析每个通道的具体含义
- 分析图像像素值分布(正态分布、长尾分布【考虑数据预处理解决长尾问题】)
- 对于多通道数据,例如通道数大于5的图像,可以分析哪些通道对于模型训练是有用的,只取其中的几个通道进行训练
- 数据后分析:对于多通道数据可以把通道分开做数据分析,同时对于用npy或pkl文件保存到数据,可以采用一些手段进行可视化操作评估。
- 对于重建任务,可以通过将重建前后的图像求差值再可视化分析区域内的重建效果
- 对于图像分类、语义分割或目标检测,可以对类别数量进行分析,若存在类别不平衡,考虑重采样以及加入FocalLoss