近日,中国科学院南海海洋研究所林强研究员团队在海洋生物物种分布模型构建中如何选择交叉验证方法取得新的研究进展,相关成果“Cross-validation matters in species distribution models: A case study with goatfish species”于2024年9月17日在线发表在国际顶尖生态学期刊Ecography上。联合培养研究生黄红伟、研究员张志新为本文共同第一作者,研究员林强和张志新为本文共同通讯作者。
在全球生物多样性持续丧失的背景下,准确评估生物多样性的空间分布模式对于制定有效的保护和管理策略至关重要。物种分布模型(SDMs)已成为评估生物多样性的一种重要工具,它通过分析物种分布数据与生态因子之间的关系来预测目标物种的适宜栖息地分布。在模型构建过程中,交叉验证是评估模型预测性能的关键步骤。交叉验证通过在不同数据集上反复训练和验证模型,帮助研究人员选择最佳模型参数。虽然随机交叉验证方法是最常见的选择,但最近一些研究者提出了空间交叉验证方法,以解决随机交叉验证忽视空间自相关性的问题。
该研究通过随机交叉验证与空间交叉验证方法,以海洋近海典型鱼类—羊鱼(Actinopteri: Syngnathiformes: Mullidae)为对象进行模型的参数优化和性能评估。研究发现,两种交叉验证方法在95%的物种中得出了不同的最佳模型参数组合,并且在预测当前和未来的栖息地分布方面存在显著差异(图1)。随机交叉验证方法在预测性能上可能存在过高估计的风险,而空间交叉验证方法倾向于保守。
图1 基于随机交叉验证和空间交叉验证方法的模型预测能力和变量重要性
同步研究结果表明,尽管随机交叉验证和空间交叉验证方法在物种分布预测上存在差异,但两者均一致得出印度-澳大利亚群岛是羊鱼物种丰富度最高的地区,并且最易受到气候变化的影响(图2)。
图2 当前气候下基于随机交叉验证和空间交叉验证方法模型预测的空间及纬度分布格局
本研究首次系统性地比较了随机交叉验证与空间交叉验证方法对SDMs结果的影响,揭示了选择交叉验证方法对SDMs预测性能和结果的重要影响,为生物多样性评估研究提供了新的视角。
该研究工作得到了国家自然科学基金项目、国家重点研发计划项目等的联合资助。
相关论文信息:Hongwei Huang,Zhixin Zhang*,Ákos Bede-Fazekas,Stefano Mammola,Jiqi Gu,Jinxin Zhou,Junmei Qu,& Qiang Lin*,2024: Cross-validation matters in species distribution models: a case study with goatfish species. Ecography. DOI: 10.1111/ecog.07354.
原文链接:https://nsojournals.onlinelibrary.wiley.com/doi/full/10.1111/ecog.07354