【线性相关系数r公式】在线性统计分析中,线性相关系数(通常用符号 r 表示)是衡量两个变量之间线性关系密切程度的重要指标。它能够反映两个变量之间的变化方向和强度,取值范围在 -1 到 1 之间。r 的值越接近 1 或 -1,表示两个变量之间的线性关系越强;而 r 接近 0 则表明两者之间几乎没有线性关系。
线性相关系数 r 公式
线性相关系数 r 的计算公式如下:
$$
r = \frac{n\sum xy - \sum x \sum y}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $ 是样本数量;
- $ x $ 和 $ y $ 分别为两个变量的观测值;
- $ \sum xy $ 表示所有 $ x $ 与 $ y $ 对应乘积之和;
- $ \sum x $ 和 $ \sum y $ 分别是 $ x $ 和 $ y $ 的总和;
- $ \sum x^2 $ 和 $ \sum y^2 $ 分别是 $ x $ 和 $ y $ 的平方和。
公式说明与使用场景
| 项目 | 说明 |
| 作用 | 评估两组数据之间的线性相关程度 |
| 适用范围 | 适用于连续型变量,且数据呈线性趋势时 |
| 取值范围 | -1 ≤ r ≤ 1 |
| r = 1 | 完全正相关 |
| r = -1 | 完全负相关 |
| r ≈ 0 | 无线性相关 |
| 计算方式 | 可通过原始数据直接代入公式计算,或使用统计软件辅助 |
示例说明
假设有以下两组数据:
| x | y |
| 1 | 2 |
| 2 | 4 |
| 3 | 6 |
| 4 | 8 |
根据上述公式计算得:
- $ n = 4 $
- $ \sum x = 10 $, $ \sum y = 20 $
- $ \sum xy = 1×2 + 2×4 + 3×6 + 4×8 = 2 + 8 + 18 + 32 = 60 $
- $ \sum x^2 = 1 + 4 + 9 + 16 = 30 $
- $ \sum y^2 = 4 + 16 + 36 + 64 = 120 $
代入公式:
$$
r = \frac{4×60 - 10×20}{\sqrt{[4×30 - 10^2][4×120 - 20^2]}} = \frac{240 - 200}{\sqrt{[120 - 100][480 - 400]}} = \frac{40}{\sqrt{20×80}} = \frac{40}{\sqrt{1600}} = \frac{40}{40} = 1
$$
结果为 r = 1,说明 x 与 y 完全正相关。
总结
线性相关系数 r 是一种简单但有效的工具,用于衡量两个变量之间的线性关系。其公式虽然看似复杂,但通过系统地代入数据即可得出结果。在实际应用中,建议结合散点图进行直观判断,并注意避免将相关性误认为因果性。


