当前位置：首页 > article >正文

geemap学习笔记019：监督分类与精度验证（上）

article 2025/2/19 6:38:27

前言

上一节中介绍了非监督分类，今天就详细介绍一下监督分类与精度验证。从这一节开始，我也是配置了本地的geemap，就可以不用colab了，配置也是花了挺长时间，但好在也是能够成功应用了，准备用两节的时间介绍监督分类与精度验证。GEE中的监督分类方法主要是包括以下几种，包括决策树、随机森林(RF)、贝叶斯、支持向量机(SVM)等。监督分类主要是包括以下几个步骤：(1)收集数据，包括待分类的影像数据以及标签数据；(2)划分训练集和测试集；(3)利用训练数据训练一个分类器；(3)对原有的数据进行分类；(4)精度验证。

1 导入库并显示地图

import ee
import geemap 

ee.Initialize() #这一行代码实在本地代码中要添加的
Map = geemap.Map()
Map

2 添加数据

point = ee.Geometry.Point([-87.7719, 41.8799]) #初始化点坐标

image = (
    ee.ImageCollection('LANDSAT/LC08/C01/T1_SR') #Landsat 8数据
    .filterBounds(point) #过滤经过该点的影像
    .filterDate('2016-01-01', '2016-12-31') #与非监督不同的是，这里取了206年的数据，是为了与NLCD2016相对应
    .sort('CLOUD_COVER') #按照云量进行排序
    # .limit(10) #可以限制取前多少个
    .first() #选择第一景影像
    .select('B[1-7]') #选择1-7个波段
)

vis_params = {'min': 0, 'max': 3000, 'bands': ['B5', 'B4', 'B3']}

Map.centerObject(point, 8)
Map.addLayer(image, vis_params, "Landsat-8")

nlcd_raw = ee.Image('USGS/NLCD/NLCD2016').select('landcover').clip(image.geometry()) #加载NLCD数据，并根据影像范围进行裁剪
Map.addLayer(nlcd_raw, {}, 'NLCD')
Map

加载数据结果

3 查看图像的属性

ee.Date(image.get('system:time_start')).format('YYYY-MM-dd').getInfo() #时间属性
image.get('CLOUD_COVER').getInfo() #云量属性

4 制作数据集

以NLCD数据创建标签

4.1 准备连续的类别标签

在分类中，标签需要设定从0开始，使用 remap() 函数将类标签转换为连续的整数。

raw_class_values = nlcd_raw.get('landcover_class_values').getInfo() #获取原始数据的标签值
print(raw_class_values)

n_classes = len(raw_class_values)
new_class_values = list(range(0, n_classes)) #定义从0开始的标签
new_class_values

class_palette = nlcd_raw.get('landcover_class_palette').getInfo() #获取原始数据的颜色表
print(class_palette)

nlcd = nlcd_raw.remap(raw_class_values, new_class_values).select(
    ['remapped'], ['landcover']
) #将原始数据标签值改为新值
nlcd = nlcd.set('landcover_class_values', new_class_values)
nlcd = nlcd.set('landcover_class_palette', class_palette)

4.2 生成样本点数据集

#有多种方法可以创建用于生成训练数据集的区域
# region = Map.user_roi #可以在地图绘制ROI
# region = ee.Geometry.Rectangle([-122.6003, 37.4831, -121.8036, 37.8288]) #可以自定义矩形范围
# region = ee.Geometry.Point([-122.4439, 37.7538]).buffer(10000) #也可以创建缓冲区

# 生成样本点数据集
points = nlcd.sample(
    **{
        'region': image.geometry(),
        'scale': 30,
        'numPixels': 5000,
        'seed': 0,
        'geometries': True,  # Set this to False to ignore geometries
    }
)

Map.addLayer(points, {}, 'training', False)
Map

print(points.size().getInfo()) #打印样本点的属性
print(points.first().getInfo())

4.3 制作训练和测试数据集

# 利用这些波段用于训练和预测
bands = ['B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7']


# 这个属性储存标签.
label = 'landcover'

# 将点叠加在图像上以获得训练
sample = image.select(bands).sampleRegions(
    **{'collection': points, 'properties': [label], 'scale': 30}
)

# 添加一列伪随机数
sample = sample.randomColumn()

split = 0.7 #划分比例

training = sample.filter(ee.Filter.lt('random', split)) #小于0.7划分为训练数据
validation = sample.filter(ee.Filter.gte('random', split)) #大于等于0.7划分为训练数据

print(training.first().getInfo()) #打印第一个点的信息

5 训练分类器

# 使用默认参数训练 CART 分类器
classifier = ee.Classifier.smileCart().train(training, label, bands)

后记

大家如果有问题需要交流或者有项目需要合作，可以加Q Q ：504156006详聊，加好友请留言“CSDN”，谢谢。

查看全文

http://www.kler.cn/a/156221.html

组网技术-交换机

【线下赛游记】2023 ICPC合肥区域赛游记

你不得不知道的工业镜头使用中的常见问题

2023年11月个人工作生活总结

什么是事务？事务的特性是什么？

《python每天一小段》--（1）与GPT-3.5-turbo 模型进行对话

Leetcode1094. 拼车

泊车功能专题介绍 ———— 记忆泊车评价规程（征求意见稿）

某60区块链安全之Create2实战二学习记录

CRM在设备制造行业的应用，优化资源配置

字符串冲刺题

【STM32】STM32学习笔记-STM32简介(02)

Elasticsearch SQL插件调研与问题整理

go语言学习-包管理

Linux驱动开发学习笔记2《LED驱动开发试验》

STM32的HAL库串口编程

提权(1), 脱裤, dirty-cow 脏牛提权

Oracle-CDB容器数据库修改service_names踩坑

每周一算法：背包问题（二）完全背包

致我那为数不多的粉丝

前言