三维测量与建模笔记 - 简介
计算机视觉相关主题
主要有两个最主要的层面,几何和语义。几何层面描述了客观事实,比如物体的距离、大小、形状、位置等。语义层面则是从人类抽象出的概念出发,描述了物体是什么、行为是什么、为什么,比如自动驾驶场景中识别出信号灯,行人等物体,并能感知到这些物体的行为。
举例说明,对于几何层面,对下图进行解读
几何层面会探测出物体的几何形状、位置结构等信息。
对于语义层面,对同样的图片进行解读
语义识别会检测出N个物体,比如人物,餐具等。
将几何探测和语义分析结合到一起就能实现非常多的应用了。
三维测量与建模的应用举例
深度图生成,三维表面建模相关应用。
影视CG特效,智能驾驶相关应用。
场景分割,目标跟踪,体感游戏相关应用。
医学领域应用,MRI和辅助手术。
视觉处理中的挑战问题
不同视角下的同名点匹配问题。
不同光照条件下,同样的场景的阴影和物体亮度都不一样。
不同尺度下对同一物体的判断会受影响。
不同角度观察同一物体所产生的变化,或者是物体不同形态时(比如奔跑的马和静止的马),如何能识别出目标物体。
物体被前景物体所遮挡,如何准确识别。
物体表面和背景相似,或者背景纹理非常复杂的时候,如何正确提取特征识别物体。
运动中的物体,sensor采集的图像会模糊。
同类物体不同形状,如何准确识别。