基于机器学习的年度内土地覆盖分类
魏薇
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

魏薇,. 基于机器学习的年度内土地覆盖分类[J]. 中国土壤,2023.8. DOI:10.12721/ccn.2023.157039.
摘要: 本文利用scikit-learn的随机森林分类器对土地覆盖类型进行了分类,探讨了机器学习在分类问题上的应用效果。本文采用了多源遥感数据作为特征输入,对八种土地覆盖类型进行了识别和比较。结果表明,随机森林分类器在土地覆盖分类上表现较好,整体的准确性达到了93.5%,kappa值为0.92,说明该分类器能够有效地区分不同的土地类型。各类别的producers准确率和consumers准确率也较高,除了水体和人工林两个类别较低外,其他类别都在90%以上。本文认为,增加这两个类别的样本数量或者选择更有区分力的特征可能会提高它们的准确率。本文为机器学习在土地覆盖分类上的应用提供了一种有效的方法和参考。
关键词: 随机森林;LULC;GEE
DOI:10.12721/ccn.2023.157039
基金资助:

一、引言

老挝是东南亚内陆国家之一,拥有丰富的森林资源,森林覆盖率达到60%左右。老挝2/3的可耕地面积尚未被开发利用,具有巨大的农业潜力。然而,老挝也面临着严重的土地覆盖变化问题,主要表现为森林退化、农业扩张和城市化等,这些土地覆盖变化对老挝的生态环境和社会经济发展造成了不利影响。

森林扰动是指对森林生态系统产生破坏或改变的自然或人为的因素,如砍伐、火灾、风暴、病虫害等[1]。土地覆被分类可以反映老挝的森林资源和土地利用现状,为森林扰动的监测和评估提供基础数据。长时序森林扰动类型的分类可以识别和定量化不同类型的森林扰动,如火灾、砍伐、病虫害等,分析它们对森林结构、功能和服务的影响,预测它们的发展趋势和影响范围。土地覆被分类和森林扰动类型的分类可以相互补充和验证,提高遥感监测的精度和效率。例如,土地覆被分类可以帮助筛选出森林区域,减少非森林区域的干扰;森林扰动类型的分类可以帮助更新土地覆被变化,反映森林退化或恢复的情况。

本次的2022年土地覆被分类工作,主要用于为后期长时序森林扰动类型的分类工作提供数据支持和参考依据,高精度土地覆被产品有利于检验和评估扰动结果的准确度。这样,就可以更全面、更准确、更及时地监测和评估老挝的森林资源和土地利用情况,为老挝的生态环境保护和社会经济发展提供科学依据。

二、算法与介绍

森林是一种机器学习算法,它可以用来做分类或回归问题。它的基本思想是利用多棵决策树来对数据进行训练和预测,然后通过投票或平均的方式来得到最终的结果。随机森林的优点是它可以处理大量的特征,评估特征的重要性,减少过拟合和方差,提高准确度和泛化能力。

三、数据来源与处理

利用geemap这个Python包进行影像分类和时序分析的方法和步骤[2,3]。geemap是一个用于与Google Earth Engine(GEE)进行交互式地图制作的Python包,GEE是一个拥有多PB级别的卫星影像和地理空间数据集目录的云计算平台。本文利用geemap下载了哨兵影像数据,进行了影像分割,提取了感兴趣区域,然后利用geemap进行了监督分类,得到了土地覆盖分类结果,并对分类结果进行了精度评价①。

(一) 影像分割

本文利用geemap进行了影像分割,提取了感兴趣区域。影像分割是将影像划分为若干个具有相似特征或者属性的区域或者对象的过程。影像分割可以为后续的影像分类或者目标识别提供基础。本文使用了基于阈值的方法进行影像分割,即根据某种特征或者属性设置一个阈值,将影像中满足条件的区域提取出来。

(二)监督分类

本文利用geemap进行了监督分类,步骤如下:

1、数据集的准备。可以自行选取样本点,并在属性表内添加一列全为浮点型数据的类别标签。也可以直接使用现有数据进行分层抽样,抽样成几何类型点群。为防止训练数据集有缺陷,可以使用QGIS→先进行shp修复→再进行几何修复→导出修复后的数据集。

2、数据集的分割。可以添加随机数列,将数据集完全随机分为:80%的训练数据集和20%的验证数据集。也可以将数据集按照各个样本类型均匀抽样(如4:1),保证训练和验证数据集的类别比例一致。

3、分类器的使用。目前已实现随机森林分类和cart分类。

4、分类结果显示。以土地覆盖分类为例,可以将结果按照数据类型映射颜色数组,生成分类图。可以为分类结果添加图例(图例标题,图例分类)。

5、定量精度评价。分别用训练数据集和验证数据集求出误差矩阵。计算混淆矩阵得到精度的定量评价。整体精度计算:数字形式。kappa:数字形式。 producers:数组形式,按类别顺序显示其对应精度。consumers:同上。

四、结果

(一)可视化结果1.png图1 随机森林分类器的土地覆被可视化结果

(二)验证结果2.png

图2 随机森林分类器的土地覆被验证结果

随机森林分类器在土地分类上表现得较好,整体的准确性和kappa值都较高,说明该分类器能够有效地区分不同的土地类型。验证整体producers准确率表示每个真实类别被正确预测的比例,验证整体consumers准确率表示每个预测类别中正确的比例。从结果来看,大部分类别的producers准确率和consumers准确率都很高。后面将尝试增加这水体和道路这两个类别的样本数量或者选择更有区分力的特征来提高它们的准确率。

五、讨论

在本文中利用scikit-learn的随机森林分类器进行土地覆盖分类,初步实现了机器学习在分类问题上的应用效果。在后续的工作中,可尝试其他的分类器,如贝叶斯、支持向量机等,比较它们的计算精度,并选取最适合的分类算法。 

注释:

①老挝琅南塔省土地覆被分类-随机森林代码(https://github.com/Vivianweiw/laos_louang_namtha_lulc)

作者简介:魏薇(1998-),女,汉族,湖北襄阳人,学历:硕士在读,研究方向:遥感应用,单位:长江大学地球科学学院。

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。