黄土高原沟壑区日极端温度空间插值方法比较
DOI,PDF 下载: 0  浏览: 7 
作者白悦江白燕霞刘延平孙智辉
作者单位延安市气象局
摘要:

陕北黄土高原是最适合发展苹果种植的区域,形成了400万亩全国最大的陕北山地苹果集中连片种植区域。在多年的山地苹果生产中,花期冻害成为主要气象灾害,2010年以后有5a出现大范围冻害天气[1]。丘陵沟壑区,地形破碎,果园分散,温度差异大,精细冻害气象服务是一项科学难题,严重制约着苹果产业发展。

空间插值是将离散点尺度数据转换为连续面尺度数据的方法,其基本假设是:空间上相距越近的点具有相似特征的可能性越大,反之则越小[2]。但在沟壑的影响下相邻点的数据往往差异很大,常用的插值算法如反距离权重法(IDW)、样条插值以及普通Kriging法等,主要考虑了空间距离对要素的影响,插值精度受到影响。

复杂地形影响下的温度插值研究,通过建立温度与数字高程模型(Digital Elevation Model, DEM)、 经纬度等因素的相关关系,通过多元回归的方法进行空间推算,发现具有更高的精度与更好的模拟效果[3],但在丘陵沟壑区插值精度较差。与平均温度相比,极端温度随机性更强,空间插值难度大,但极端温度是气象灾害预警和评估的最直接因素,插值方法研究较少。一些方法对平均温度模拟较好,日极端温度的模拟效果较差。研究表明[4-6],利用随机森林回归、多元线性回归开展日极端温度插值更好。本文利用随机森林、投影寻踪、神经网络、多元回归等方法建立温度与高程、经纬度的回归方程进行空间插值并与传统的反距离权重、克里金等插值方法进行插值比较,寻找一种基础插值方法,然后再对残差进一步分析,确定一种综合插值方法,从而提高极端温度插值的准确度,更好地服务于气象防灾减灾。

1 资料与方法

1.1 研究区概况

研究区为位于延安市西北部的吴起、志丹县,地处黄土高原丘陵沟壑区,洛河上游,海拔高度1 093-1 809 m,境内沟壑纵横,梁峁密布,山高坡陡,沟谷深切。国土面积7 581 km2。常住人口29.51万人。止2021年底,志丹苹果园面积达到2×104 hm2,挂果园面积达到0.83×104 hm2,总产量9万吨,实现产值达4.3亿元。吴起苹果种植面积0.6×104  hm2,苹果产量1.7万吨。

1.2 资料来源

气象数据由吴起县、志丹县气象站提供。志丹有40个温度观测点、吴起有68个温度观测点。2022年4月15日~5月2日,出现了两次明显降温过程,对苹果生产造成影响。选取4月15、18、23、25、28日最高温度进行插值分析,利用两次降温过后的4月19日、20日、5月1日、2日的最低温度数据,开展最低温度插值对比分析。DEM为1:5万数据。

1.3 空间插值方法

随机森林回归(RF)一种以决策树为基本学习器构建的集成算法,其利用 bagging 的思想集成很多决策树来提升模型精度。投影寻踪回归(PPR)是处理和分析高维数据的一类新兴的统计方法,其基本思想是将高维数据投影到低维(1~3维)子空间上,寻找出反映原高维数据的结构或特征的投影,以达到研究和分析高维数据的目的。神经网络回归按误差逆传播算法训练的多层前馈网络。多元逐步回归(MLR)是研究一个因变量、与两个或两个以上自变量的回归。  反距离权重插值(IDW)称为距离倒数乘方法。是指距离倒数乘方格网化方法是一个加权平均插值法,可以进行确切的或者圆滑的方式插值。克里金插值(OK)又称空间自协方差最佳插值法。是基于变异函数和结构分析,利用样本点的原始数据和变异函数的结构特点,对未采样点值进行线性无偏最优估计。

1.4  精度对比分析

使用均方根误差(RMSE)、 平均绝对误差(MAE)来验证上述插值方法的插值精度。RMSE反映极值效应、MAE 反映可能的误差范围,定量地给出误差。RMSE 和 MAE的值越小,表示模型的插值精度越高。

2  数据分析

2.1  温度数据分析

分析发现,多数时间日高温度与经纬度没有相关,在冷空气影响下或阴天时,日最高温度与海拔的相关可通过检验(4月15-18日,27-28日),其它时间段相关不明显。在少数时间段与经纬度有相关关系。日最低温度与海拔、经纬度有相关关系,在晴空背景下,黄土高原丘陵沟壑区日最低温度主要与海拔呈明显相关关系,与经纬度相关不明显。对4天数据进行相关分析,具有相同规律,温度与海拔的相关系数在0.45~0.55之间,可通过0.001的显著性检验,表明海拔越高,日最低温度越高;与经度的相关系数在0.02~0.14之间,没有通过检验;与纬度的相关系数在-0.12~-0.24之间,只有4月20日通过0.05的显著性检验,相关系数为负值,说明纬度高,温度低。

4月19日最高温度7.2 ℃,最低温度-7.9 ℃,温差15.1 ℃;4月20日最高温度8.5 ℃,最低温度-3.7 ℃,温差12.2 ℃;5月1日最高温度6.5 ℃,最低温度-7.9 ℃,温差14.4 ℃;5月2日最高温度11.3 ℃,最低温度-4.5 ℃,温差15.8 ℃。5月1日苹果处于花期,出现了部分果园苹果花受冻现象。

截图20250826141130.png

2.2  日最高温度的插值精度对比

日最高温度的6种插值方法比较,MAE排序为RF <OK<MLR<BP <PPR <IDW, 数值分别为1.03 ℃,1.33 ℃,1.67 ℃,1.72 ℃,2.18 ℃,2.26 ℃,RMSE排序为RF <OK<MLR <BP < IDW < PPR,数据分别为1.14 ℃,1.50 ℃,1.68 ℃,1.71℃,2.54 ℃,2.59 ℃。综合分析,RF最好, OK次之,MLR与BP居中,而PPR和IDW最差。RF的插值平均绝对误差控制在1℃,效果较好。

2.2  日最低温度不同方法插值精度对比

比较沟壑区日最低温度6种方法中预测值与实测值的MAE、RMSE可以看出,6种方法的 MAE排序为BP<RF<PPR<MLR<IDW<OK, 数值分别为1.97 ℃,2.03 ℃,2.03 ℃,2.2 ℃,3.9 ℃,4.22 ℃,BP、RF、PPR的非常接近,也明显小于传统的IGW和OK;6种方法的 RMSE排序为RF < BP <PPR<MLR<IDW<OK,数值分别为2.64 ℃,3.01 ℃,3.41 ℃,3.45 ℃,4.53 ℃,4.66 ℃,RF的RMSE明显小于其它方法。6种方法的插值精度,RF虽然MAE不是最小,但与最小值仅相差0.06 ℃,而且RF的RMSE明显小,综合分析表明RF的误差最小,预测精度最高,OK误差最大,预测精度最低。

分析4天的插值精度,6种插值方法具有一致性,当温差越小,插值精度越高,温差越大,插值精度越差。如4月20日,温差最小为12.2 ℃,MAE平均为2.27 ℃,而5月2日,温差最大为15.8 ℃,MAE平均为3.23 ℃,两天的MAE相差接近1 ℃。RF虽然也有这样的插值规律,但MAE表现更为稳定,4月20日最小为1.71 ℃,5月2日最大为2.44 ℃,只相差了0.73 ℃。

2.3  插值效果对比

在日最高温度的插值分析中,RF的插值平均绝对误差控制在1℃,效果较好。

日最低温度6种插值方法比较机器学习插值方法最好,线性回归次之,传统插值方法最差。传统插值方法的IDW好于OK,而机器学习插值以RF最好。IDW插值,以温度站点为中心形成温度牛眼,温度连续性差;多元线性回归计算得到的温度分布图,表现出河谷温度低而山顶温度高的特征,但在河谷地带表现为河流下游海拔越低的地方温度也越低,误差最大的地方在吴起无定河流域,实测温度最低但计算温度很高; RF插值,也形成了根据地形特点的温度分布,完全反映出河谷温度低,山顶高的温度分布特征,在河谷地带表现出河流下游温度高、上游温度低的无定河流域的温度也低,弥补了多元线性回归的缺点。通过机器学习的方法进行最低温度插值效果更好。

2.4  日最低温度插值残差分析

回归分析在进行最低温度插值时,能够反映出温度随地形变化的特征,但平均误差还比较大,误差在2 ℃左右,最小的4月20日平均误差1.5 ℃,而5月1日、5月2日平均误差在2.4 ℃,提高插值精度是必要的。 分析5月1日残差数据,按照线性倾向R2的大小从大到小排序,RF>PPR>BP>线性回归,表明RF方法最好。

2.5  RF插值精度提高分析

对RF残差做进一步分析,发现低温数据,模拟值普遍高于实测值,而高温数值,模拟值普遍低于实测值。在可以发现模拟值与实测数据有较好的线性关系,y=1.5 591x+0.1 365,R2=0.8 163,式中y为实测值,x为模拟值,在GIS中利用这一方程对回归分析得到的图进行计算,得到订正后的图和数据。

经订正后的吴起志丹最低温度与RF回归比较,区域内最低温度由-4.7 ℃变为-7.2 ℃,最高温度由3.9 ℃变为6.2 ℃,与实测温度更加接近。读取12个测试样本数据,发现残差最大值为1.66 ℃,最小值为0.06 ℃,平均值为0.8 ℃,与订正前相比平均下降了0.9 ℃,效果较好(表1)。订正后并不是所有误差都减小,有的还增大,但订正对误差较大数据的减小作用还是非常明显的。

截图20250826141318.png

3  结论与讨论

基于机器学习的日最高温度插值方法比较,以随机森林回归表现最好,插值绝对误差在1℃左右。日最低温度插值精度也是机器学习方法显著高于传统的反距离权重法和普通克里金插值法,也高于多元线性回归计算结果。在三种机器学习方法中,随机森林回归表现最好,投影寻踪和神经网络较差。随机森林回归的计算温度与实测温度有较好的线性关系,通过一元线性回归订正后可显著降低误差,将误差降至1℃以下。

参考文献

 [1]雷延鹏,孙智辉,曹雪梅,等.延安5次苹果花期冻害影响分析[J].中国农学通报,2018,34(32):102-107.

 [2]朱浩楠,刘晓冉,李永华,等.考虑地形的空间插值算法在复杂下垫面地区气温和降水精细化插值的评估[J].气象,2020,46(05):655-665.

[3]马诺,唐冶,常存,等.基于DEM的气温空间插值方法比较[J].干旱气象,2020,38(03):465-471.

[4]贺倩,汪明,刘凯, 基于机器学习的气温要素空间插值[J]. 高原气象.2022,41(3):733-748.

[5] 杨春华,郑莉,黄河清,等. 重庆山地区域气象要素空间插值方法对比[ J] . 气象与环境学报,2022,38(4) :57 - 66

[6]邢立亭,李净,焦文慧.基于MODIS和随机森林的兰州市日最高气温和最低气温估算[J].干旱区研究,2020,37(03):689-695.

版权所有 © 2025 世纪中文出版社  京ICP备2024086036号-2