可视化环境数据中隐藏的统计结构的方法
气候和天气的预测依赖于统计模型,这些模型可以捕捉一个位置随时间的变化以及与其他地理位置的关系。有时可以根据另一位置的当前条件预测一个位置的未来条件,而在其他情况下可能没有这种相关性。两个站点是否以一种或另一种方式“协变”的假设会对统计模型的准确性产生深远的影响,因此时空协方差的选择至关重要。
来自 KAUST 的 Ying Sun 和她的学生 Huang Huang 现在开发了一种可视化数据集时空协方差特性的方法,大大简化了以前需要艰苦探索性数据分析的重要建模步骤。
“我们提出了一种简单方便的方法来可视化数据中协方差结构的属性,这将有助于从业者为协方差选择合适的统计模型,”Sun 说。“特别是,这种方法对于观察到的空间稀疏而时间密集的数据很有用,例如气象站观测就是这种情况。”
Sun 和 Huang 考虑了协方差对称性和可分离性的两种关键类型。对称性意味着时空过程在时间上是可逆的,而可分离性表明时间上的相关性与空间上的相关性不相互作用。
“假设一个完全对称或可分离的协方差会导致一个更简单的模型,因此计算速度更快,”Sun 说。“然而,这个模型假设在许多实际应用中可能会被违反,导致估计和预测不太准确。”
Huang 和 Sun 使用函数数据分析方法从位置对之间的时间序列数据的协方差构建测试函数。这些测试函数有效地总结了可分离性或对称性的属性,并且可以显示为显示不可分离性或不对称性程度的箱线图。
“我们将这种方法应用于气象观测和来自一些常用气候模型的模拟天气数据,”黄说。“在北大西洋研究区报告的例子中,这种方法表明,风速和地表温度在不同季节具有不同的协方差结构。”
对于少数几个监测站,可以相对快速地计算可视化,研究人员指出,通过将问题划分为子区域,可以提高更多站的计算效率。然而,该方法提供了一个有价值的工具,将极大地帮助从业者。