神经网络八股(2)
1.数据增强算法
基于样本变换的数据增强:旋转,翻转,缩放,裁剪,噪声添加,色彩调整(亮度,对比度)
混合数据增强方法:mixup(两张图像按照一定混合成一幅图像),cutmix(从A图像随机裁剪一小块放到B图像中,进行直c接覆盖),Cutout方法(随机删除图像中的某一部分)
2.如何解决正负样本不均衡的问题
负样本不均衡是指在数据集中,不同类别的样本数量存在显著差异的现象。
数据方面:增加少样本数目
模型方面:修改损失函数,使用带有权重的损失函数
评估指标:免使用准确率作为唯一指标,改用精确率、召回率,F1分数更全面的指标
精确率:测为正样本的样本中,实际为正样本的比例
召回率:实际为正样本的样本中,模型正确预测为正样本的比例
F1分数:精确率和召回率的调和平均数
3.小目标检测是目标检测的痛难点,如何解决?
数据增强:增多样本数,调整图像分辨率,增加数据多样性
特征提取:多尺度多级特征提取,注意力机制
损失函数优化;无锚点检测,迁移学习
4.opencv中都有哪些边缘检测算子
索贝尔算子(sobel):通过卷积核在水平和垂直方向上分别求取一阶导数,从而突出显示图像中的边界
拉普拉斯算子:二阶微分算子,用于检测图像中的边缘
canny边缘检测:高斯滤波去除噪声;梯度计算使用Sobel算子计算梯度幅值和方向;非极大值抑制保留局部最大梯度值,双阈值检测通过高低阈值确定最终的边缘
5.深度可分离卷积:
将传统的卷积操作分解为两个独立的步骤——深度卷积和逐点卷积
深度卷积:对输入特征图的每个通道独立进行卷积操作。每个输入通道使用一个独立的卷积核,不与其他通道共享权重
逐点卷积:使用1x1的卷积核对深度卷积的输出进行卷积操作,目的是将不同通道的特征进行融合
6.常用的插值方法
插值方法是一种数学技术,用于根据已知数据点生成新的数据点。
最近邻插值:选择最近的已知数据点作为插值结果。对于图像缩放,最近邻插值会将目标像素的值设置为最近的源像素值。
-
不会引入新的像素值,因此不会模糊图像。
-
但可能导致图像出现明显的锯齿效应。
-
对速度要求高且对图像质量要求不高的场景
双线性插值:通过计算目标点周围4个最近邻点的加权平均值来确定插值结果。权重与距离成反比
7.高斯滤波器的原理
只要是滤波,都有自己的卷积核,卷积核内有自己的权重参数,在图像中滑动时和图像对应的像素进行相乘,而卷积核内的权重参数分布就符合高斯函数分布,中间高两边低。
8.目标检测中的map计算
map就是多个类别的pr曲线之和的平均值,P就是精确值,R就是召回率
9.AP和mAP的区别?
ap是坐标系PR曲线下的微分面积,m是多个类别的平均
10.输入多尺度的图像怎么给图像做到统一输出
图像缩放,图像填充,图像裁剪(大图像随机裁剪成小图像),图像金字塔(FPN)多尺度融合