当前位置: 首页 > article >正文

使用 ArcGIS Pro 进行土地利用分类的机器学习和深度学习

 

随着技术进步,尤其是地理信息系统 (GIS)工具的进步,可以更有效地对土地利用进行分类。分类的使用可用于识别植被覆盖变化、非法采矿区和植被抑制区域,这些只是土地利用分类的众多示例中的一部分。

分类的一大困难是确定要解决的问题的级别。我分类的目的是什么?分类是否需要具有高精度以减少对人工交互进行校正的需要?分类的目的只是为了识别随时间的变化吗?是否会使用机器学习分类来减轻地理团队的工作量?只有免费图片才能解决我的问题?

简要介绍这项工作中使用的两种学习类型,机器学习深度学习有什么区别?

机器学习是机器学习的一种形式,是人工智能 (AI) 领域的一个子集,它使系统能够向操作员学习。这个学习领域使用数据来训练和找到准确的结果。

深度学习 或深度学习已经是机器学习的一个子集,模型将从更复杂的神经网络中学习。算法的创建就像机器学习一样,但包含更复杂的层次和更强大的计算能力。

理解这种差异的一种更简单的方法是,机器学习更依赖于人为干预进行学习,而深度学习则不依赖于人为干预。根据 Lex Fridman 的说法,深度学习是一种“更具可扩展性的机器学习” 。

第一种方法是使用机器学习技术进行分类,在这种分类中可以使用两种类型的方法,例如无监督或监督,并联合使用,称为混合分类。

假设类的数量和迭代次数给定,算法能够识别类的无监督方法。这种分类通常由称为聚类的分组方法使用。

监督方法需要一个运算符,该运算符将从图像中创建样本并表示要分类的每个类。关于这项工作,我选择仅使用监督方法进行机器学习。

这项工作的第一阶段是使用Earth Explorer平台下载Sentinel-2A图像。下载图像后,我将 4 个感兴趣的波段导出到 ArcGIS,蓝色 (B2)、绿色 (B3)、红色 (B4) 和红外 (B8) 波段。在条带之间进行假色合成 (8,4,3),并使用感兴趣区域 (ROI) 切割合成。

 机器学习分类

为分类定义的类别是:水、原始森林、裸露的土壤、农业、人工林和田地,记住这项工作只是一个应用示例。

定义类后,我创建了多边形格式的样本,包含要作为一个整体分类的图像。我将面向对象的方法与随机树分类器结合使用,除了这些分类器之外还有其他分类器,例如:最大似然,支持向量机,k-最近邻。

随机分类器由一起运行的决策树组成,每棵树决定类别,得票最多的类别成为模型预测。下面是一个例子,说明最后一类的票数最高,在这种情况下,在一个水果篮中,我们有 2 棵苹果树和 1 棵香蕉树,最后一类将被定义为苹果,用于展示 2/3总票数。

 

为了进行分类,我对复合材料进行了分段,因为它是面向对象方法的必要步骤。分割对具有相似特征的像素进行分组,是减少逐像素分类中分散像素的替代方法。

这一步使用的工具是Image Classification Wizard,分类结果如下图所示。左图代表 RGB 合成,右图代表分类。

 

混淆矩阵

分类后,我用推理样本执行了混淆矩阵。主对角线表示以“正确”方式分配给每个类别的样本数量,行和列表示样本“出错”的位置,使用此数据可以为我们的模型执行准确性Kappa索引. 混淆矩阵显示89% 的准确度85% 的 kappa

 

深度学习排名

为了利用上次分类的结果,我会将栅格文件转换为多边形,并在“为深度学习导出训练数据”工具中使用它,之后使用一些参数作为模型的基础,以及一个 45°使用旋转角度,这将有助于增加我的图像(样本)。此步骤耗时约 2 小时 51 分钟。

随着数据的导出,现在是训练深度学习模型的步骤。下一个工具是Train Deep Learning Model,我使用10个epochs,也就是模型通过整个层的次数,以及Resnet34架构,一种用于更复杂训练的神经网络,之后我使用10这些数据的百分比用于模型验证。

1 小时 40 分钟后,模型得到训练,其准确率约为 79%。现在是最期待的一步,我们要测试我们的模型,我将使用相同的组合,但在不同的地方训练。这一步使用的工具是Classify Pixels Using Deep Learning结果如下图所示,我将真彩色图像与分类结果进行了比较。

 

在这两种分类中,原生植被和人工林之间以及田野和农业之间都存在问题,但这项工作的主要目的是基于机器学习提出这两种分类形式。

机器学习分类的准确率为 89%,而深度学习分类为79%。这并不意味着一种分类比另一种更好,而是需要在两种学习中进行更多的测试。

在某些情况下,使用机器学习对土地利用进行分类已经是一种解决方案,但在更复杂的情况下,有必要使用深度学习


http://www.kler.cn/news/10334.html

相关文章:

  • SpringBoot常见的的面试点
  • ArrayList、LinkedList与Vector的区别?
  • 【自用】HTML笔记
  • VS Code 快捷键
  • 【C++11那些事儿(一)】
  • pandas读取Excel核心源码剖析,面向过程仿openpyxl源码实现Excel数据加载
  • 【RabbitMQ】
  • MATLAB算法实战应用案例精讲-【深度学习】多尺度特征融合(论文篇一)
  • Java知识点学习(第13天)
  • springboot零基础到项目实战
  • UI学习路线图2023完整版(适合自学)
  • 使用git log统计代码行数
  • 【K8S系列】深入解析无状态服务
  • 文件访问被拒绝?5个解决方法!
  • 云原生周刊:一文读懂 Pod 网络 | 2023.4.10
  • Jmeter接口测试和性能测试
  • 力扣刷题笔记26——最小的k个数/快速排序学习/快排与冒泡的时间复杂度
  • 信息与计算科学有哪些SCI期刊推荐? - 易智编译EaseEditing
  • 如何用nodejs构造一个网站爬虫
  • 傅盛“追风”GPT,猎户星空春天来了?
  • 【WebGIS实例】(7)MapboxGL绘制不同颜色的Symbol图标
  • 服务(第五篇)Nginx!!!
  • 2023年全国最新道路运输从业人员精选真题及答案48
  • 【Chatgpt4 教学】 NLP(自然语言处理)第十课NLP文本分类应用和卷积神经网络(CNN)
  • BFC理解和应用
  • 【Java EE】-多线程编程(十) HashMapHashTableConcurrentHashMap之间的区别
  • chapter-1数据管理技术的发展
  • 私有化部署VideoTogether一起看视频
  • 微积分——极值定理的证明
  • Jetson nano部署剪枝YOLOv8