Development and validation of a cultivability evaluation model for cultivated land reserve resources: Coupling random forest with the limiting factor method
Received date: 2024-07-25
Revised date: 2025-04-24
Online published: 2025-10-13
[Objective] To address the subjective limitations of the current limiting factor method, this study introduced a machine learning model to enhance the objectivity and efficiency of the cultivability evaluation of cultivated land reserve resources. [Methods] Using Anyuan County, Jiangxi Province as a case study, and based on 768 sample patches from the land use change survey in 2020, the cultivability evaluation was transformed into a binary classification problem. Using the evaluation results of the limiting factor method derived from the same data source as labels, a random forest model was constructed. The mean decrease Gini (MDG) was used to analyze feature importance for optimizing the evaluation indicator system. Additionally, model performance was comprehensively evaluated through cross-validation, area under the curve (AUC) value, and Kappa coefficient. [Results] (1) The model achieved an average accuracy exceeding 0.990 on the training set, test set, and cross-validation, with the test set AUC reaching 0.999. Furthermore, the learning curves indicated that the model had high accuracy and strong generalization capability. (2) The model evaluation results showed an overall consistency of 93.07% with the limiting factor method (Kappa = 0.794). The inconsistent patches exhibited a significantly dispersed distribution (R = 1.836, p < 0.001), mainly concentrated in heterogeneous areas such as regions where the proportion of slopes >25° was near the threshold and urban development boundaries, revealing the model’s limitations and indicating directions for improvement. (3) The quantitative ranking of key factor importance was as follows: ecological condition (40.29%), cultivation convenience (25.68%), soil texture (16.17%), soil layer thickness (8.27%), soil pH (8.26%), terrain slope (1.12%), and soil heavy metal pollution status (0.22%). This highlighted the prominent ecological characteristics and shallow soil conditions of the region. [Conclusion] This study provides an intelligent and quantitative evaluation of the cultivability of cultivated land reserve resources. The constructed model highlights the dominant roles of ecological and cultivation conditions in hilly regions of southern China, providing a scientific basis for regional land-use management and policy implementation.
ZHANG Hui , ZHOU Songshan , LEI Hengcong , LI Mangen , CHEN Niannan , WANG Yuxin . Development and validation of a cultivability evaluation model for cultivated land reserve resources: Coupling random forest with the limiting factor method[J]. Resources Science, 2025 , 47(9) : 1915 -1928 . DOI: 10.18402/resci.2025.09.07
表1 耕地后备资源调查评价指标体系Table 1 Survey and evaluation indicator system for cultivated land reserve resources |
| 指标名称 | 指标说明 | 指标值分类 | 指标值代码 |
|---|---|---|---|
| 生态条件 | 后备资源地块是否位于生态保护红线、城镇开发边界外,或开发是否会导致土地退化、或引起地质灾害对自然生态系统造成重大影响 | 生态保护红线和城镇开发边界外 | 1 |
| 生态保护红线或城镇开发边界内或开发会导致土地退化或引发地质灾害 | 2 | ||
| 地形坡度 | 后备资源地块地形坡度是否≤25° | ≤25° | 1 |
| >25° | 2 | ||
| ≥10 ℃年积温 | 后备资源地块是否位于年有效积温≥1800 ℃的区域 | ≥1800 ℃ | 1 |
| <1800 ℃ | 2 | ||
| 年降水量 | 后备资源地块是否位于年降水量≥400 mm区域或年降水量<400 mm但有灌溉条件 | ≥400 mm或<400 mm有灌溉条件 | 1 |
| <400 mm无灌溉条件 | 2 | ||
| 土壤质地 | 后备资源地块是否属于砾质土或更粗 质地土壤 | 壤质、粘质或砂质 | 1 |
| 砾质或更粗质地 | 2 | ||
| 土壤重金属污染状况 | 后备资源地块土壤是否遭受污染 | 土壤未遭受污染 | 1 |
| 土壤遭受污染 | 2 | ||
| 盐渍化程度 | 后备资源地块土壤盐渍化程度是否在重度以下且有灌溉排水条件 | 无、轻度盐化和中度盐化或重度盐化有灌溉排水条件 | 1 |
| 重度盐化无灌溉排水条件 | 2 | ||
| 土壤pH值 | 后备资源地块pH值是否在4.0~9.5之间 | 4.0~9.5 | 1 |
| ≤4.0或≥9.5 | 2 | ||
| 土层厚度 | 后备资源地块是否满足≥60 cm,或有客土土源 | ≥60 cm或<60 cm有客土土源 | 1 |
| <60 cm无客土土源 | 2 | ||
| 耕作便利度 | 后备资源地块是否方便到达耕种,是否可持续利用 | 面积>20 hm2或有道路到达 | 1 |
| 图斑面积≤20 hm2且没有道路到达 | 2 |
表2 耕地后备资源评价数据来源Table 2 Data sources for evaluation of cultivated land reserve resources |
| 指标名称 | 涉及原始资料 | 数据来源部门 |
|---|---|---|
| 生态条件 | “三区三线”成果数据,地质灾害隐患点 | 自然资源部门 |
| 地形坡度 | 安远县坡度图 | 自然资源部门 |
| ≥10 ℃年积温 | 安远县2017—2021年≥10 ℃积温观测数据 | 气象部门 |
| 年降水量 | 基于气象站观测的安远县2017—2021年年降水量数据 | 气象部门 |
| 土壤质地 | 第二次全国土壤普查成果、耕地后备资源调查评价成果、耕地质量等别评价数据、耕地质量分类、土地质量地球化学调查成果、外业调查数据 | 自然资源部门/ 农业农村部门 |
| 土壤重金属污染状况 | 安远县土壤重金属污染图层 | 生态环境部门 |
| 盐渍化程度 | 第二次全国耕地后备资源调查评价成果、安远县土壤盐渍化状况调查数据 | 农业农村部门 |
| 土壤pH值 | 第二次全国土壤普查成果、耕地后备资源调查评价成果、耕地质量等别评价数据、耕地质量分类、土地质量地球化学调查成果、外业调查数据 | 自然资源部门/ 农业农村部门 |
| 土层厚度 | 第二次全国土壤普查成果、耕地后备资源调查评价成果、耕地质量等别评价数据、耕地质量分类、土地质量地球化学调查成果、外业调查数据 | 自然资源部门/ 农业农村部门 |
| 耕作便利度 | 第三次全国国土调查2020年度国土变更调查成果、地理国情监测数据、遥感影像 | 自然资源部门 |
图3 安远县耕地后备资源单项评价指标空间分布图注:本文初始指标体系严格遵循 《技术方案》 的10项指标。尽管≥10 ℃年积温、年降水量和盐渍化程度3项指标在安远全县均属宜耕,但仍予保留,主要基于两点考量:①确保与国家标准的可比性,为模型优化提供完整基准;②验证随机森林模型能够自动识别并剔除在特定区域无判别意义的因子,证明该方法具备适应区域差异的潜力,为其他地区构建本地化评价体系提供参考。最终优化形成7个关键指标集。 Figure 3 Spatial distribution of individual evaluation indicators for cultivated land reserve resources in Anyuan County |
表3 模型最优参数Table 3 Optimal model parameters |
| 模型参数 | 特征变量数量 | |
|---|---|---|
| 10 | 7 | |
| 决策树个数(n_estimators) | 100 | 50 |
| 树的最大深度(max_depth) | None | None |
| 最大特征数(max_feature) | 1 | 1 |
| 随机抽取的样本数量(max_samples) | 0.2 | 0.2 |
| 拆分内部节点所需的最少样本数(min_samples_split) | 2 | 2 |
| 在叶节点上所需的最少样本数(min_samples_leaf) | 1 | 1 |
| 随机数种子(random_state) | 42 | 42 |
表4 模型预测结果与限制性因子法评价结果混淆矩阵Table 4 A confusion matrix between the model predictions and limiting factor evaluation results |
| 限制性因子法 评价结果 | 模型预测结果 | ||
|---|---|---|---|
| 不宜耕/个 | 宜耕/个 | 合计/个 | |
| 不宜耕 | 18 | 5 | 23 |
| 宜耕 | 2 | 76 | 78 |
| 合计 | 20 | 81 | 101 |
图6 模型预测结果与限制性因子法评价结果差异分布图Figure 6 Distribution of discrepancies between model predictions and limiting factor evaluation results |
表5 差异图斑空间分布的平均最近邻分析结果Table 5 Average nearest neighbor analysis results of spatial distribution of discrepant patches |
| 指标 | 值 |
|---|---|
| 观测平均距离 | 11522.3 m |
| 预期平均距离 | 6275.1 m |
| 最近邻比率(R) | 1.836 |
| z得分 | 4.232 |
| p值 | < 0.001 |
表6 随机森林模型(n_features = 7)特征变量重要性统计表Table 6 Statistics of feature variable importance of random forest model (n_features =7) |
| 特征变量 | n_features = 7,n_estimators = 164 | |
|---|---|---|
| 特征变量贡献率/% | 特征变量重要性排序 | |
| 生态条件 | 40.29 | 1 |
| 地形坡度 | 1.12 | 6 |
| 土壤质地 | 16.17 | 3 |
| 土壤重金属污染状况 | 0.22 | 7 |
| 土壤pH值 | 8.26 | 5 |
| 土层厚度 | 8.27 | 4 |
| 耕作便利度 | 25.68 | 2 |
| [1] |
王广华. 切实加强耕地保护改革完善占补平衡制度[N]. 人民日报, 2023-10-10(010).
[
|
| [2] |
新华社. 事关粮食安全这个“国之大者”: 全国土地日专访自然资源部部长、国家自然资源总督察王广华[N/OL]. 中华人民共和国中央人民政府门户网站, (2023-06-25) [2025-08-31]. https://www.gov.cn/zhengce/202306/content_6888372.htm.
[
|
| [3] |
白雪源, 张杰, 崔振岭, 等. 中低产田评价指标与主要方法研究进展[J]. 土壤学报, 2023, 60(4): 913-924.
[
|
| [4] |
汤怀志, 桑玲玲, 郧文聚. 我国耕地占补平衡政策实施困境及科技创新方向[J]. 中国科学院院刊, 2020, 35(5): 637-644.
[
|
| [5] |
梁鑫源, 金晓斌, 韩博, 等. 藏粮于地背景下国家耕地战略储备制度演进[J]. 资源科学, 2022, 44(1): 181-196.
[
|
| [6] |
常钦. “占优补优”, 改革完善耕地占补平衡管理[N]. 人民日报, 2025-01-04(002).
[
|
| [7] |
张露, 罗必良. “三位一体”耕地保护: 背景、目标与策略选择[J]. 江汉论坛, 2024, (11): 5-14.
[
|
| [8] |
高星, 吴克宁, 周娜. 景泰县耕地后备资源生态敏感性评价与空间利用对策研究[J]. 中国农业资源与区划, 2020, 41(4): 43-51.
[
|
| [9] |
鲍贞羽. 基于生态安全的子长市耕地后备资源开发适宜性评价[D]. 西安: 长安大学, 2023.
[
|
| [10] |
罗恬欣. 基于生态敏感性的袁州区耕地后备资源适宜性评价及开发利用研究[D]. 南昌: 江西农业大学, 2023.
[
|
| [11] |
|
| [12] |
|
| [13] |
孙佩, 周凌云, 易洁伟, 等. 2021年耕地后备资源及生态风险评价: 以丹江口市为例[J]. 中国农学通报, 2023, 39(29): 68-73.
[
|
| [14] |
王慧敏. “限制性因子”法在内蒙古高原地区耕地后备资源调查评价中的应用[D]. 长春: 吉林大学, 2015.
[
|
| [15] |
毕玮, 党小虎, 马慧, 等. “藏粮于地”视角下西北地区耕地适宜性及开发潜力评价[J]. 农业工程学报, 2021, 37(7): 235-243.
[
|
| [16] |
叶达, 吴克宁, 刘霈珈. 基于正态云模型与熵权法的景泰县耕地后备资源开发潜力评价[J]. 中国农业资源与区划, 2016, 37(6): 22-28.
[
|
| [17] |
杨永侠, 施彦如, 孙婷, 等. 基于空间聚类的西藏耕地后备资源开发组合模型[J]. 农业机械学报, 2016, 47(4): 239-247.
[
|
| [18] |
张金亭, 董艳超, 方斌. 基于灰色关联法的耕地后备资源供需耦合分析[J]. 地域研究与开发, 2020, 39(1): 163-167, 174.
[
|
| [19] |
周建义. 安远县耕地后备资源评价[D]. 南昌: 江西农业大学, 2018.
[
|
| [20] |
自然资源部. 全国耕地后备资源调查评价技术方案[Z]. 北京: 自然资源部, 2021.
[Ministry of Natural Resources. National Technical Scheme for Investigation and Evaluation of Cultivated Land Reserve Resources[Z]. Beijing: Ministry of Natural Resources, 2021.]
|
| [21] |
李恒凯, 王利娟, 肖松松. 基于多源数据的南方丘陵山地土地利用随机森林分类[J]. 农业工程学报, 2021, 37(7): 244-251.
[
|
| [22] |
王李娟, 孔钰如, 杨小冬, 等. 基于特征优选随机森林算法的农耕区土地利用分类[J]. 农业工程学报, 2020, 36(4): 244-250.
[
|
| [23] |
何云, 黄翀, 李贺, 等. 基于Sentinel-2A影像特征优选的随机森林土地覆盖分类[J]. 资源科学, 2019, 41(5): 992-1001.
[
|
| [24] |
潘雨飘, 赵翔, 王静, 等. 基于SMOTE-RF算法的村庄发展类型识别方法研究[J]. 地球信息科学学报, 2023, 25(1): 163-176.
[
|
| [25] |
赵孟辰, 阿里木江·卡斯木. 基于Sentinel-2遥感影像的农作物分类与适宜性评价[J]. 西南大学学报(自然科学版), 2023, 45(11): 176-185.
[
|
| [26] |
周嵩山, 梁永刚, 曾丹. 赣南苏区耕地后备资源调查评价方法研究与探讨: 以安远县为例[J]. 国土与自然资源研究, 2024, (1): 19-22.
[
|
| [27] |
王冲, 张景, 彭博, 等. 基于“双评价”的国土空间格局优化研究: 以江西省安远县为例[J]. 华北地质, 2023, 46(2): 69-78.
[
|
| [28] |
中国国家统计局. 国家统计局关于2020年粮食产量数据的公告[EB/OL]. (2020-12-10) [2025-09-13]. https://www.stats.gov.cn/sj/zxfb/202302/t20230203_1900927.html.
[National Bureau of Statistics of China. Announcement on the Grain Output Data of 2020[EB/OL]. (2020-12-10) [2025-08-31]. https://www.stats.gov.cn/sj/zxfb/202302/t20230203_1900927.html.]
|
| [29] |
|
| [30] |
杜培军, 慕号伟, 郭山川, 等. 集成学习遥感应用: 进展与展望[J]. 遥感学报, 2025, 29(6): 1614-1635.
[
|
| [31] |
李坤, 赵俊三, 林伊琳, 等. 基于SMOTE和多粒度级联森林的泥石流易发性评价[J]. 农业工程学报, 2022, 38(6): 113-121.
[
|
| [32] |
付光明. 基于机器学习的三维成矿预测研究[D]. 南昌: 东华理工大学, 2021.
[
|
| [33] |
宋友城. 顾及空间异质性和差异化演变特征的土地利用变化模拟和预测[J]. 武汉大学学报(信息科学版), 2025, 50(8): 1732.
[
|
| [34] |
李亮亮, 白路遥, 施宁, 等. 基于空间异质性的降雨诱发滑坡易发性研究: 以中缅天然气管道贵州段为例[J]. 自然灾害学报, 2025, 34(4): 62-73.
[
|
| [35] |
徐然, 邓力凡, 张经度, 等. 基于深度学习的耕地后备资源潜力评价方法研究[J/OL]. 时空信息学报, (2025-07-29) [2025-08-30]. https://link.cnki.net/urlid/10.1904.p.20250728.1357.002.
[
|
| [36] |
窦朴严, 张丽君, 秦耀辰, 等. 耦合多源大数据与随机森林模型的郑州市居民用电碳排放非线性影响[J/OL]. 生态学报, (2025-08-29) [2025-08-30]. https://doi.org/10.20103/j.stxb.202502040232.
[
|
| [37] |
闫卫坡, 郭亚琳, 王青, 等. 供需动态平衡下资源环境承载力评价理论模型与方法[J]. 世界科技研究与发展, 2023, 45(S1): 114-123.
[
|
| [38] |
肖劲松, 张皓, 李凌月. 集体土地用途管制逻辑探索: 基于土地发展权的视角[J]. 自然资源学报, 2025, 40(9): 2556-2572.
[
|
| [39] |
谷国政, 施琳娜, 文琦, 等. 乡村空心化治理视角下区域耕地多功能与价值耦合协调研究[J]. 地理科学进展, 2024, 43(3): 587-602.
[
|
| [40] |
|
| [41] |
刘镇杭, 池源, 欧阳绿茵, 等. 沿海地区城镇化进程对碳平衡的影响机制及空间异质性[J/OL]. 地理科学, [2025-09-02][2025-09-13]. https://doi.org/10.13249/j.cnki.sgs.20240716.
[
|
| [42] |
李溦, 何国华, 赵勇, 等. 供水工程影响下中国北方地区耕地后备资源开发潜力[J]. 农业工程学报, 2024, 40(5): 264-274.
[
|
| [43] |
|
/
| 〈 |
|
〉 |