首先计算机视觉能够解决哪些问题??
分类、检测、分割
首先以下面这幅图为例:
分类就是输入一张图像,算法能够告诉我们图像中有什么类别,比如说猫或者狗,而并不知道这个类别在图像中的位置,如果我们引入位置,用一个矩形框把图像中的单独物体给他框出来,并且做分类的话,那么称之为分类和定位,而如果图像中有多个类别的多个物体,我们要把每一个物体用矩形框框出来,并且识别出框中的类别,这就是目标检测问题,目标检测问题已经能够实现实例级的识别了,就是能够把图像中的每一个物体都单独拎出来识别,那如果我们不满足画框,想像photoshop那样抠图一样,获得像素级别的更细粒度的抠图信息呢,这就称之为图像分割。