【超几何分布公式】在概率论与数理统计中,超几何分布是一种离散型概率分布,用于描述在不放回抽样过程中,成功事件发生的次数。它常用于从有限总体中抽取样本时的随机变量建模。与二项分布不同,超几何分布适用于不放回抽样,因此每次试验的概率会随着抽样的进行而变化。
一、超几何分布的基本概念
超几何分布的定义如下:
设有一个总体,包含 $ N $ 个元素,其中 $ K $ 个是“成功”元素(如合格品),其余 $ N - K $ 个为“失败”元素(如不合格品)。从中随机抽取 $ n $ 个元素,不放回,设这 $ n $ 个元素中有 $ k $ 个是成功的,则随机变量 $ X $ 的概率分布服从超几何分布。
记作:$ X \sim H(N, K, n) $
二、超几何分布的概率质量函数
超几何分布的概率质量函数(PMF)为:
$$
P(X = k) = \frac{\dbinom{K}{k} \cdot \dbinom{N - K}{n - k}}{\dbinom{N}{n}}
$$
其中:
- $ N $:总体大小;
- $ K $:总体中成功元素的数量;
- $ n $:样本容量;
- $ k $:样本中成功元素的数量;
- $ \dbinom{a}{b} $ 表示组合数,即从 $ a $ 个元素中选取 $ b $ 个的方式数。
三、超几何分布的期望与方差
| 项目 | 公式 |
| 期望值 | $ E(X) = n \cdot \frac{K}{N} $ |
| 方差 | $ Var(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ |
四、超几何分布与二项分布的区别
| 特征 | 超几何分布 | 二项分布 |
| 抽样方式 | 不放回抽样 | 有放回抽样 |
| 每次试验概率 | 不同(依赖于前一次结果) | 相同(独立事件) |
| 总体大小 | 有限 | 无限或近似无限 |
| 适用场景 | 小样本、有限总体 | 大样本、独立事件 |
五、应用实例
假设一个工厂生产了 100 个产品,其中有 20 个是次品。现从中随机抽取 5 个产品,求其中恰好有 2 个次品的概率。
根据超几何分布公式:
- $ N = 100 $
- $ K = 20 $
- $ n = 5 $
- $ k = 2 $
代入公式得:
$$
P(X = 2) = \frac{\dbinom{20}{2} \cdot \dbinom{80}{3}}{\dbinom{100}{5}} \approx 0.297
$$
即,抽到 2 个次品的概率约为 29.7%。
六、总结
超几何分布是一种重要的概率模型,广泛应用于质量控制、抽样调查、生物统计等领域。其核心在于处理不放回抽样中的成功概率问题。通过理解其公式、期望和方差,可以更准确地分析实际问题中的随机现象。与二项分布相比,超几何分布更加贴近现实中的有限总体抽样情境。


