当前位置: 首页 > article >正文

geemap学习笔记019:监督分类与精度验证(上)

前言

上一节中介绍了非监督分类,今天就详细介绍一下监督分类与精度验证。从这一节开始,我也是配置了本地的geemap,就可以不用colab了,配置也是花了挺长时间,但好在也是能够成功应用了,准备用两节的时间介绍监督分类与精度验证。GEE中的监督分类方法主要是包括以下几种,包括决策树、随机森林(RF)、贝叶斯、支持向量机(SVM)等。监督分类主要是包括以下几个步骤:(1)收集数据,包括待分类的影像数据以及标签数据;(2)划分训练集和测试集;(3)利用训练数据训练一个分类器;(3)对原有的数据进行分类;(4)精度验证。

image.png

1 导入库并显示地图

import ee
import geemap 

ee.Initialize() #这一行代码实在本地代码中要添加的
Map = geemap.Map()
Map

2 添加数据

point = ee.Geometry.Point([-87.7719, 41.8799]) #初始化点坐标

image = (
    ee.ImageCollection('LANDSAT/LC08/C01/T1_SR') #Landsat 8数据
    .filterBounds(point) #过滤经过该点的影像
    .filterDate('2016-01-01', '2016-12-31') #与非监督不同的是,这里取了206年的数据,是为了与NLCD2016相对应
    .sort('CLOUD_COVER') #按照云量进行排序
    # .limit(10) #可以限制取前多少个
    .first() #选择第一景影像
    .select('B[1-7]') #选择1-7个波段
)

vis_params = {'min': 0, 'max': 3000, 'bands': ['B5', 'B4', 'B3']}

Map.centerObject(point, 8)
Map.addLayer(image, vis_params, "Landsat-8")

nlcd_raw = ee.Image('USGS/NLCD/NLCD2016').select('landcover').clip(image.geometry()) #加载NLCD数据,并根据影像范围进行裁剪
Map.addLayer(nlcd_raw, {}, 'NLCD')
Map

加载数据结果
image.png

3 查看图像的属性

ee.Date(image.get('system:time_start')).format('YYYY-MM-dd').getInfo() #时间属性
image.get('CLOUD_COVER').getInfo() #云量属性

4 制作数据集

以NLCD数据创建标签
image.png

4.1 准备连续的类别标签

在分类中,标签需要设定从0开始,使用 remap() 函数将类标签转换为连续的整数。

raw_class_values = nlcd_raw.get('landcover_class_values').getInfo() #获取原始数据的标签值
print(raw_class_values)

n_classes = len(raw_class_values)
new_class_values = list(range(0, n_classes)) #定义从0开始的标签
new_class_values

class_palette = nlcd_raw.get('landcover_class_palette').getInfo() #获取原始数据的颜色表
print(class_palette)

nlcd = nlcd_raw.remap(raw_class_values, new_class_values).select(
    ['remapped'], ['landcover']
) #将原始数据标签值改为新值
nlcd = nlcd.set('landcover_class_values', new_class_values)
nlcd = nlcd.set('landcover_class_palette', class_palette)

4.2 生成样本点数据集

#有多种方法可以创建用于生成训练数据集的区域
# region = Map.user_roi #可以在地图绘制ROI
# region = ee.Geometry.Rectangle([-122.6003, 37.4831, -121.8036, 37.8288]) #可以自定义矩形范围
# region = ee.Geometry.Point([-122.4439, 37.7538]).buffer(10000) #也可以创建缓冲区

# 生成样本点数据集
points = nlcd.sample(
    **{
        'region': image.geometry(),
        'scale': 30,
        'numPixels': 5000,
        'seed': 0,
        'geometries': True,  # Set this to False to ignore geometries
    }
)

Map.addLayer(points, {}, 'training', False)
Map

print(points.size().getInfo()) #打印样本点的属性
print(points.first().getInfo())

4.3 制作训练和测试数据集

# 利用这些波段用于训练和预测
bands = ['B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7']


# 这个属性储存标签.
label = 'landcover'

# 将点叠加在图像上以获得训练
sample = image.select(bands).sampleRegions(
    **{'collection': points, 'properties': [label], 'scale': 30}
)

# 添加一列伪随机数
sample = sample.randomColumn()

split = 0.7 #划分比例

training = sample.filter(ee.Filter.lt('random', split)) #小于0.7划分为训练数据
validation = sample.filter(ee.Filter.gte('random', split)) #大于等于0.7划分为训练数据

print(training.first().getInfo()) #打印第一个点的信息

5 训练分类器

# 使用默认参数训练 CART 分类器
classifier = ee.Classifier.smileCart().train(training, label, bands)

后记

大家如果有问题需要交流或者有项目需要合作,可以加Q Q :504156006详聊,加好友请留言“CSDN”,谢谢。


http://www.kler.cn/a/156221.html

相关文章:

  • 使用pytest+openpyxl做接口自动化遇到的问题
  • 2024 年 8 个最佳 API 设计工具图文介绍
  • 开源vs闭源:你更看好哪一方?
  • 【css】html里面的图片宽度设为百分比,高度要与宽度一样
  • 使用ookii-dialogs-wpf在WPF选择文件夹时能输入路径
  • 通过脚本,发起分支合并请求和打tag
  • 组网技术-交换机
  • 【线下赛游记】2023 ICPC合肥区域赛 游记
  • 你不得不知道的工业镜头使用中的常见问题
  • 2023年11月个人工作生活总结
  • 什么是事务?事务的特性是什么?
  • 《python每天一小段》--(1)与GPT-3.5-turbo 模型进行对话
  • Leetcode1094. 拼车
  • 泊车功能专题介绍 ———— 记忆泊车评价规程(征求意见稿)
  • 某60区块链安全之Create2实战二学习记录
  • CRM在设备制造行业的应用,优化资源配置
  • 字符串冲刺题
  • 【STM32】STM32学习笔记-STM32简介(02)
  • Elasticsearch SQL插件调研与问题整理
  • go语言学习-包管理
  • Linux驱动开发学习笔记2《LED驱动开发试验》
  • STM32的HAL库串口编程
  • 提权(1), 脱裤, dirty-cow 脏牛提权
  • Oracle-CDB容器数据库修改service_names踩坑
  • 每周一算法:背包问题(二)完全背包
  • 致我那为数不多的粉丝