更简单的统计测试是否能正确表征数据集
空间环境数据与常用统计分析之间不匹配的研究表明,在许多情况下,简单的统计就足够了。环境科学家和他们的统计学家同事面临着一个共同的困境:更简单的统计测试是否能正确表征数据集?是否值得努力推导出和应用可能更匹配但更难以解释的统计方法?在大多数情况下,阻力最小的路径会获胜,但选择简单的统计基础可能会对统计得出的研究结果的有效性产生轻微怀疑。

KAUST 研究员 Marc Genton 和他的博士生 Yuan Yan 开发了一个框架来准确测试数据和统计分析之间的不匹配可能有多不准确,结果令人惊讶。
“研究人员倾向于用简单的高斯模型拟合空间数据——围绕平均值的经典对称钟形曲线——即使数据可能具有不对称分布,特征与高斯分布不同,”严说。“我们在错误的高斯假设下研究了数据的‘非高斯性’对统计估计和预测的影响。”
高斯分布通常是直观的,平均值和与平均值的标准偏差意味着数据的一些窄或宽分布。它们被广泛应用和理解,无论是从从业者的角度还是从非技术用户的角度来看。但是,在许多情况下,特别是对于环境数据,数据的分布是有偏差的。例如,风速和降雨量不能小于零,但平均值较小但分布扩展到较高值的高斯分布可能会在下端有一个尾部延伸到负值——当然是错误的,但有多少?
空间统计分析中最重要的概念之一是数据在相隔一定距离时相互影响的强度,这由所谓的协方差函数给出。Genton 和 Yan 开始系统地研究应用高斯模型来估计非高斯数据的协方差函数的效果。
“我们开发了一种量身定制的模拟方案,以生成具有给定协方差结构的非高斯空间数据,”Genton 说。“我们通过模拟研究表明,当空间数据是非高斯数据时,协方差参数的高斯似然估计器仍然比非严重偏斜数据的替代加权最小二乘估计器表现更好。”
该发现表明,在许多情况下,简单的高斯模型实际上通常足以用于空间数据的参数估计,这为空间科学家选择统计方法提供了一些安慰。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
【李白行路难全文及翻译】《行路难》是唐代诗人李白的代表作之一,全诗表达了诗人面对人生道路艰难、理想受阻...浏览全文>>
-
【贴春联时福要倒着贴寓意具体是什么】在传统春节习俗中,贴春联是一项重要的活动,而“福”字倒着贴是其中一...浏览全文>>
-
【光辉岁月歌词谐音】《光辉岁月》是李宗盛为刘德华创作的一首经典歌曲,旋律悠扬,歌词深情。在日常生活中,...浏览全文>>
-
【嘎鱼炖豆腐的做法】嘎鱼炖豆腐是一道极具地方特色的家常菜,尤其在东北地区广受欢迎。嘎鱼肉质鲜嫩,搭配豆...浏览全文>>
-
【金惠美是谁】“金惠美是谁”是近年来在社交媒体和网络平台上频繁出现的一个问题。随着信息传播的加速,越来...浏览全文>>
-
【厕所餐厅的意思是什么】“厕所餐厅”这一说法在日常生活中并不常见,但近年来随着网络语言的多样化和一些特...浏览全文>>
-
【xr刷机报错53什么意思】在使用XR设备(如Xiaomi Redmi系列)进行刷机过程中,用户可能会遇到各种错误提示。...浏览全文>>
-
【韩国明星到中国吃饭的节目叫什么】近年来,随着中韩文化交流的日益频繁,不少韩国艺人开始尝试走进中国市场...浏览全文>>
-
【黄土高原海拔高度是多少米】黄土高原是中国重要的地理区域之一,位于中国中部,横跨山西、陕西、甘肃、宁夏...浏览全文>>
-
【win10开机进不了系统怎么办】在使用Windows 10的过程中,有时会遇到开机后无法进入系统的情况,这不仅影响...浏览全文>>
